Neben den Quellentypen PDF, URL, Dokument und Frage-Antwort-Paar können auch CSV-Dateien genutzt werden.
Eine CSV-Datei beschreibt eine Tabelle, die eine feste Struktur besitzt. Dabei beschreibt die Titelzeile, was in den einzelnen Spalten für Informationen/Daten enthalten sind.
Die Titelzeile ist zwingend erforderlich und eine möglichst genaue Spaltenbezeichnung empfohlen.
Der Titel einer Spalte muss dabei unique sein, um korrekte Zuordnungen zu ermöglichen.
Beim Import der CSV-Datei besteht die Möglichkeit zu definieren, welche Spalten-Titel importiert werden sollen. Standardmäßig erfolgt der Import der gesamten Tabelle. Durch Abwahl der unwichtigen Titel werden Teile der Tabelle ausgeschlossen.
Die Titel-Spalten beschreiben hierbei den Teil, nach dem die Nutzer:innen am wahrscheinlichsten fragen.
Die zu importierenden Spalten beschreiben die Datenspalten, auf die die KI zugreift, um Anfragen zu beantworten. Hier sollten alle Spalten mit relevanten Informationen ausgewählt sein und irrelevante Spalten entfernt werden.
Je größer die Anzahl an importierten Spalten ist, desto größer ist das Potenzial für ungenaue oder fehlerhafte Antworten.
Empfohlen ist der Einsatz von CSV-Dateien in spezifischen Themen. Die Erfahrungen zeigen, dass das Fehlerpotenzial bei Einbindung in spezifische Themen geringer ausfällt als bei Nutzung in der allgemeinen Knowledge Base. Die Nutzung von CSV-Dateien führt aufgrund der strukturierten Daten zu einer hohen Antwortqualität.