Forschende benötigen einfachere und stärker automatisierte Möglichkeiten, FAIR-konforme Metadaten zu erstellen. Bestehende Werkzeuge weisen derzeit Lücken in Abdeckung und Konsistenz auf. ConnOSS zielt darauf ab, diese Defizite mithilfe von Machine Learning zu beheben und gleichzeitig gute wissenschaftliche Praktiken zu unterstützen.
Die FAIR-Prinzipien betonen die Bedeutung von maschinenverarbeitbaren Metadaten, um die Qualität, Transparenz und Reproduzierbarkeit von Forschung zu verbessern. Forschende, die Software entwickeln, verfügen jedoch häufig weder über die nötige Zeit noch über das Fachwissen, um umfassende Metadaten manuell zu erstellen, und wünschen sich daher automatisierte, aufwandsarme Lösungen.
Bestehende Werkzeuge und Schemata (z. B. CodeMeta, Bioschemas, maSMP) decken Metadatenelemente bislang nur teilweise ab und kämpfen mit Inkonsistenzen sowie eingeschränkter Automatisierung. Zudem besteht ein klarer Bedarf, Metadaten aus verschiedenen Quellen (z. B. GitHub API, Zitationsdateien, README-Dateien) zu harmonisieren und sowohl für Menschen als auch Maschinen leicht zugänglich zu machen.
Das Ziel ist die Entwicklung der Connected Open Source Software (ConnOSS)-Infrastruktur, die: