Datensatz (en.: dataset)

Sammlung von Daten mit einem gemeinsamen Format und zielrelevantem Inhalt. Im Idealfall repräsentieren die so ausgewählten Daten den größeren Datensatz bzw. die angenommene reale Charakteristik.

Anmerkung: Datensätze können zum Training, zur Validierung sowie zum Testen eines KI-Modells verwendet werden. Im Kontext des überwachten maschinellen Lernens stellen Datensätze eine Grundlage für das Training des Lernalgorithmus dar.

Beispiel 1: Mikroblogging-Beiträge vom Juni 2020, die mit den Hashtags #rugby und #football verknüpft sind.

Beispiel 2: Makrofotos von Blumen mit der Größe 256x256 Pixel.

ISO/IEC DIS 22989 collection of data with a shared format and goal-relevant content.

EXAMPLE 1: Micro-blogging posts from June 2020 associated with hashtags #rugby and #football.

EXAMPLE 2: Macro photographs of flowers in 256x256 pixels.

Note 1 to entry: Datasets can be used for validating or testing an AI model. In a machine learning (3.2.9) context, datasets can also be used to train a machine learning algorithm (3.2.10)

ISTQB - CTAI Syllabus A collection of data used for training, evaluation, testing and prediction in ML

Quelle: AI-Glossary.org (https://www.ai-glossary.org), Lizenz d. Definitionstextes (ausschl. Norm-Referenzen): CC BY-SA 4.0, abgerufen: 2024-10-30

BibTeX-Information

@misc{aiglossary_Datensatz_18mllfa,
author = {{AI-Glossary.org}},
title = {{Datensatz}},
howpublished = "https://www.ai-glossary.org/index.php?p=18mllfa\&l=de",
year = "2024",
note = "online, abgerufen: 2024-10-30" }