English bias in computing: Bilder zur Rettung

2022-09-11 07:12:33 By : Ms. Angel Huang

Klicken Sie hier, um sich mit oder anzumeldenSo viele Sprachen;und doch wird dem Englischen fast die totale Dominanz eingeräumt, wenn es um die KI-Technologie Machine Learning (ML) geht.Wenn Forscher zum Beispiel einen Computer darin trainieren, den Inhalt eines zufälligen Textes zu verstehen, werden die Trainingsbeispiele typischerweise auf Englisch sein.„Dies führt zu einer erheblichen unbeabsichtigten kulturellen Voreingenommenheit. Selbst nach umfangreichem Training wird die Maschine niemals der Stierzähmung in Indien, dem chinesischen Eintopfkochen oder anderen Phänomenen ausgesetzt gewesen sein, die Millionen von Menschen vertraut sind, aber zufällig lügen außerhalb des englischsprachigen Horizonts", sagt Ph.D.Forscher Emanuele Bugliarello, Institut für Informatik (DIKU), Universität Kopenhagen.In einer wahrhaft interkulturellen Anstrengung haben Bugliarello und Kollegen aus einer Reihe von Ländern ein neues Instrument geschaffen, das einen vielfältigeren Ansatz fördert.IGLUE (Image-Grounded Language Understanding Evaluation), wie sie das Tool genannt haben, ist ein Benchmark, der es ermöglicht, die Effizienz einer ML-Lösung in 20 Sprachen (anstelle von Englisch allein) zu bewerten.Ihr wissenschaftlicher Artikel zur Einführung von IGLUE wurde zur Veröffentlichung in den kommenden Proceedings of The Thirty-ninth International Conference on Machine Learning angenommen, einer der führenden Konferenzen auf diesem Gebiet.Freiwillige stellten kulturspezifische Bilder zur VerfügungWie kann ein neuer Benchmark etwas bewirken?„Wenn ML-Forschungsteams neue Lösungen entwickeln, sind sie immer sehr wettbewerbsfähig. Wenn es einer anderen Gruppe gelungen ist, eine bestimmte ML-Aufgabe mit 98 Prozent Genauigkeit zu lösen, werden Sie versuchen, 99 Prozent zu erreichen und so weiter. Das treibt das Feld voran. Aber der Nachteil ist, dass, wenn Sie keinen richtigen Benchmark für ein bestimmtes Feature haben, es nicht priorisiert wird. Dies war bei multimodalem ML der Fall, und IGLUE ist unser Versuch, die Szene zu ändern", sagt Bugliarello.Das bildbasierte Training ist in ML Standard.Die Bilder sind jedoch normalerweise "beschriftet", was bedeutet, dass jedes Bild von Textteilen begleitet wird, die den Lernprozess der Maschine unterstützen.Während die Etiketten normalerweise auf Englisch sind, deckt IGLUE 20 typologisch unterschiedliche Sprachen ab, die 11 Sprachfamilien, 9 Schriften und 3 geografische Makrobereiche umfassen.Ein Teil der Bilder in IGLUE sind kulturspezifisch.Diese Bilder wurden durch eine Mail-Kampagne erhalten.Die Forscher baten Freiwillige in geografisch unterschiedlichen Ländern, Bilder und Texte in ihrer natürlichen Sprache und vorzugsweise über Dinge bereitzustellen, die in diesem Land wichtig sind.Der derzeitige Mangel an multimodalem ML hat praktische Auswirkungen, erklärt Bugliarello:„Nehmen wir an, Sie haben eine Lebensmittelallergie und Sie haben eine App, die Ihnen sagen kann, ob die problematischen Zutaten in einer Mahlzeit vorhanden sind. Wenn Sie sich in einem Restaurant in China befinden, stellen Sie fest, dass die Speisekarte vollständig auf Chinesisch ist, aber Bilder enthält Ihre App ist gut, vielleicht übersetzt sie das Bild in ein Rezept – aber nur, wenn die Maschine während des Trainings chinesischen Proben ausgesetzt war.“Mit anderen Worten, Nicht-Englischsprachige erhalten eine schlechtere Version von ML-basierten Lösungen:„Die Leistung vieler Top-ML-Lösungen wird sofort sinken, wenn sie Daten aus nicht englischsprachigen Ländern ausgesetzt werden. Und insbesondere verpassen die ML-Lösungen Konzepte und Ideen, die nicht in Europa oder Nordamerika entwickelt werden. Das ist etwas mit denen sich die ML-Forschungsgemeinschaft befassen muss", sagt Bugliarello.Glücklicherweise haben viele Kollegen das Licht gesehen, bemerkt Bugliarello:„Das alles begann vor ein paar Jahren, als wir ein Paper für die EMNLP-Konferenz (Empirical Methods in Natural Language Processing) schrieben. Wir wollten nur auf ein Problem hinweisen, wurden aber bald von Interesse überwältigt, und zu unserer großen Überraschung war unser Beitrag als bestes langes Papier ausgewählt. Die Leute haben das Problem klar gesehen, und wir wurden ermutigt, mehr zu tun."Kann Sehbehinderten helfenManchmal fühlt sich der aktuelle Erfolg fast wie eine Bürde an, gibt Bugliarello zu:„Als öffentliche Universität haben wir begrenzte Ressourcen. Wir können nicht alle Aspekte dieser riesigen Aufgabe verfolgen. Dennoch sehen wir, dass andere Gruppen sich anschließen. Wir spüren auch das Interesse der großen Technologiekonzerne. Sie engagieren sich stark ML und beginnen zu erkennen, wie problematisch Englisch sein kann. Offensichtlich sind sie nicht glücklich darüber, dass die Leistung ihrer Lösungen erheblich abnimmt, wenn sie außerhalb des englischsprachigen Kontexts angewendet werden."Trotz der positiven Entwicklungen lässt sich Bugliarello nicht beirren.Auf die Frage, wie nah wir dem Ziel des vorurteilsfreien maschinellen Lernens sind, antwortet er:"Oh, wir sind sehr weit weg."Dabei geht es aber nicht nur um kulturelle Gleichberechtigung:„Die Methodik hinter IGLUE könnte mehrere Anwendungen finden. Beispielsweise hoffen wir, Lösungen für Sehbehinderte zu verbessern. Es gibt Tools, die Sehbehinderten dabei helfen, der Handlung eines Films oder einer anderen Art der visuellen Kommunikation zu folgen. Diese Tools sind derzeit alles andere als perfekt , und ich würde sie sehr gerne verbessern können. Dies liegt jedoch noch etwas in der Zukunft", sagt Bugliarello. Erkunden Sie weiter. Eine Methode des maschinellen Lernens halluziniert ihren Weg zu einer besseren Textübersetzung. IGLUE: A Benchmark for Transfer Learning across Modalities, Tasks, and Languages, Proceedings of The Thirty-ninth International Conference on Machine Learning (2022).DOI: 10.48550/arXiv.2201.11732 Bereitgestellt von der Universität Kopenhagen Zitat: English bias in computing: Images to the rescue (2022, 6. September), abgerufen am 11. September 2022 von https://techxplore.com/news/2022-09-english- bias-images.html Dieses Dokument ist urheberrechtlich geschützt.Abgesehen von einem fairen Handel zum Zwecke des privaten Studiums oder der Forschung darf kein Teil ohne schriftliche Genehmigung reproduziert werden.Der Inhalt dient nur zu Informationszwecken.Verwenden Sie dieses Formular, wenn Sie auf einen Tippfehler oder eine Ungenauigkeit gestoßen sind oder eine Bearbeitungsanfrage für den Inhalt dieser Seite senden möchten.Für allgemeine Anfragen nutzen Sie bitte unser Kontaktformular.Verwenden Sie für allgemeines Feedback den Abschnitt für öffentliche Kommentare unten (bitte beachten Sie die Richtlinien).Bitte wählen Sie die am besten geeignete Kategorie aus, um die Bearbeitung Ihrer Anfrage zu erleichternVielen Dank, dass Sie sich die Zeit genommen haben, der Redaktion Ihr Feedback zu geben.Ihr Feedback ist uns wichtig.Aufgrund des hohen Nachrichtenaufkommens garantieren wir jedoch keine individuelle Beantwortung.Ihre E-Mail-Adresse wird nur verwendet, um dem Empfänger mitzuteilen, wer die E-Mail gesendet hat.Weder Ihre Adresse noch die Adresse des Empfängers werden für andere Zwecke verwendet.Die von Ihnen eingegebenen Informationen erscheinen in Ihrer E-Mail-Nachricht und werden von Tech Xplore in keiner Form gespeichert.Tägliche Wissenschaftsnachrichten über Forschungsentwicklungen und die neuesten wissenschaftlichen InnovationenFortschritte in der medizinischen Forschung und GesundheitsnachrichtenDie umfassendste Sci-Tech-Berichterstattung im InternetDiese Website verwendet Cookies, um die Navigation zu unterstützen, Ihre Nutzung unserer Dienste zu analysieren, Daten für personalisierte Anzeigen zu sammeln und Inhalte von Drittanbietern bereitzustellen.Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Datenschutzrichtlinie und Nutzungsbedingungen gelesen und verstanden haben.