Lernen mit Indien: KI-Sprachassistenten
Bei Künstlicher Intelligenz (KI) kommen deutsche und indische Interessen zusammen. Warum es wichtig ist, dass KI-Systeme mit vielen Sprachen trainieren, zeigt ein Besuch auf dem Subkontinent.
Auf den ersten Blick liegen Welten zwischen diesen beiden Orten: dem Indian Institute of Science (IISc) im globalen Innovationshub Bangalore und einem Basisgesundheitszentrum im Bundesstaat Uttar Pradesh. Was das Team um IISc-Professor Prasanta Kumar Ghosh und die Gemeindekrankenschwestern miteinander verbindet, sind muttersprachliche KI-Chatbots, die die Versorgung von Schwangeren und Neugeborenen in entlegenen Regionen verbessern.
Pilotprojekt mit 2.000 Gemeindekrankenschwestern
In Uttar Pradesh hat die gemeinnützige Organisation ARMMAN ein Pilotprojekt mit einem mehrsprachigen KI-Assistenten für Gesundheitsfachkräfte gestartet. Er liefert Antworten in Echtzeit per Text- oder Sprachnachricht, etwa zu Risikoschwangerschaften, erläutert Amrita Mahale von ARMMAN: „2.000 Gemeindekrankenschwestern haben wir bereits eingebunden, sie betreuen mehr als 400.000 schwangere Frauen.“
Eine dieser Frauen schildert Meena Yadav ihre Beschwerden: Schwindel, Herzrasen. Yadav greift zum Handy und stellt dem Chatbot von ARMMAN eine Frage in Hindi mit regionalem Dialekt. Binnen Sekunden kommt die Antwort: Verdacht auf Anämie, dazu Empfehlungen. Klar, verständlich, medizinisch abgesichert. Für viele Gemeindekrankenschwestern ist das essenziell. Sie arbeiten fernab von Kliniken und Ärzt*innen und müssen schnell reagieren.
Nur mit den richtigen Sprachdaten kann KI für alle funktionieren
Das Team am Indian Institute of Science hat das Sprach-KI-Tool mit authentischen Stimmen „gefüttert“ und Hunderte Stunden Sprachaufnahmen in neun indischen Sprachen erstellt: Bengali, Bhojpuri, Chhattisgarhi, Hindi, Kannada, Magahi, Maithili, Marathi und Telugu. Mehr als 900 Millionen Menschen sprechen diese Sprachen. Dennoch fehlen oft vielfältige, nicht-englische Datensätze.
Damit sich das ändert, hat die BMZ-Initiative „FAIR Forward – Künstliche Intelligenz für Alle“ in Indien mit dem Ministerium für Elektronik und Informationstechnologie, der Wissenschaft und der Zivilgesellschaft kooperiert.
Nach Abstimmung mit Muttersprachler*innen wurden die Sprachaufnahmen produziert. „FAIR Forward“ sorgte mit seinen Partnern zudem dafür, dass die Daten öffentlich zugänglich sind. Bhavika Nanawati, KI-Beraterin bei der Initiative, sagt: „Die offenen Sprachdaten tragen dazu bei, dass damit Menschen bis in entlegene Dörfer erreicht werden können, die vorher noch nicht von den Angeboten profitierten. Indem wir Anwendungen dank Sprach-KI auf besondere Bedürfnisse anpassen, werden unsere Partnerschaften noch wirkungsvoller."
„FAIR Forward fördert frei verfügbare, offene Datensätze und KI-Modelle und setzt damit die Verpflichtungen der Hamburg Declaration on Responsible AI for the SDGs um.“
Die BMZ-Initiative „FAIR Forward – Künstliche Intelligenz für Alle“ fördert unter anderem offene Sprach-KI in der internationalen Zusammenarbeit. Sprachdaten und KI-Modelle wurden für viele Sprachen entwickelt. Sie ermöglichen inklusive digitale Dienste und mehr digitale Teilhabe in lokalen Sprachen. Eingesetzt werden sie etwa in der Landwirtschaft, im Gesundheits- und Bildungswesen sowie bei Behörden. Partnerländer sind, neben Indien, Ghana, Indonesien, Kenia, Ruanda, Südafrika und Uganda.
Die GIZ setzt „FAIR Forward“ im Auftrag des Bundesministeriums für wirtschaftliche Zusammenarbeit und Entwicklung (BMZ) um.
Damit die Datensätze auch praktisch genutzt werden können, arbeitete „FAIR Forward“ mit staatlichen Akteuren wie BHASHINI zusammen, Indiens staatlicher Plattform für Sprach-KI. Das Ziel: digitale öffentliche Güter (Digital Public Goods) entwickeln und bereitstellen. „Ohne ‚FAIR Forward‘ wäre dieses Projekt in vielerlei Hinsicht nicht möglich gewesen. Die Initiative hat den Wert der Sprachdaten und der Technologie erkannt und uns unterstützt“, sagt Professor Ghosh vom IISc.
Deutsch-indische KI-Vernetzung
„FAIR Forward“ brachte indische Partner mit deutschen Forschungseinrichtungen wie dem Deutschen Forschungszentrum für Künstliche Intelligenz (DFKI) zusammen. Gemeinsam bündelten sie Expertise und Rechenleistung.
„Die Arbeit von FAIR Forward in Indien bringt die KI-Technologie für alle voran und stärkt die Zusammenarbeit zwischen Deutschland und Indien im Bereich künstlicher Intelligenz.“
Zurück im Gesundheitszentrum in Uttar Pradesh. Die Gemeindekrankenschwester legt das Handy beiseite. Mit den Informationen aus dem Chatbot hat sie eine fundiertere Grundlage, um die Patientin zu beraten. „Das macht uns selbstbewusster“, sagt sie.
Auch die KI-Entwickler*innen können beim ARMMAN-Pilotprojekt dazulernen. „Wir haben bewusst mit Hindi begonnen – einer Sprache, in der wir die aussagekräftigsten Ergebnisse erwartet haben. Wenn hier etwas hakt, dann wissen wir, dass wir in anderen Sprachen nachsteuern müssen“, sagt Amrita Mahale. Das indische Gründerzentrum ARTPARK veranstaltet dazu einen Hackathon, um ein KI-System für alle neuen Sprachen des IISc zu entwickeln.
Was hier entsteht, könnte weiter wirken. Offene Sprachdaten als Basis für KI, die alle Menschen erreicht – in ihrer Sprache, im Alltag, zur richtigen Zeit. Davon kann auch die KI-Szene in Deutschland profitieren, wie Simon Ostermann vom DFKI im Interview betont: „Offene Sprachdaten aus dem Globalen Süden verbreitern die empirische Basis. Sie helfen dabei, KI-Systeme zu entwickeln, die global einsetzbar sind.“