Sammlung von Daten mit einem gemeinsamen Format und zielrelevantem Inhalt. Im Idealfall repräsentieren die so ausgewählten Daten den größeren Datensatz bzw. die angenommene reale Charakteristik.
Anmerkung: Datensätze können zum Training, zur Validierung sowie zum Testen eines KI-Modells verwendet werden. Im Kontext des überwachten maschinellen Lernens stellen Datensätze eine Grundlage für das Training des Lernalgorithmus dar.
Beispiel 1: Mikroblogging-Beiträge vom Juni 2020, die mit den Hashtags #rugby und #football verknüpft sind.
Beispiel 2: Makrofotos von Blumen mit der Größe 256x256 Pixel.
ISO/IEC DIS 22989 collection of data with a shared format and goal-relevant content.
EXAMPLE 1: Micro-blogging posts from June 2020 associated with hashtags #rugby and #football.
EXAMPLE 2: Macro photographs of flowers in 256x256 pixels.
Note 1 to entry: Datasets can be used for validating or testing an AI model. In a machine learning (3.2.9) context, datasets can also be used to train a machine learning algorithm (3.2.10)
ISTQB - CTAI Syllabus A collection of data used for training, evaluation, testing and prediction in ML