Le Hub invite les chercheurs, linguistes, startups, technologues et organisations communautaires africains à créer des ensembles de données de haute qualité, inclusifs et axés sur la communauté pour 50 langues africaines.
Le Hub invite les chercheurs, linguistes, startups, technologues et organisations communautaires africains à créer des ensembles de données de haute qualité, inclusifs et axés sur la communauté pour 50 langues africaines.
Le Hub des Langues Africaines Masakhane (le Hub) a annoncé un important appel à propositions (RFP) pour remédier à la grave sous-représentation des langues africaines dans l'intelligence artificielle (IA). Le Hub invite les chercheurs, linguistes, startups, technologues et organisations communautaires africains à créer des ensembles de données de haute qualité, inclusifs et axés sur la communauté pour 50 langues africaines.
Alors que l’Afrique abrite plus de 2 000 langues, celles-ci sont presque absentes du paysage numérique mondial ; Aucune des 34 langues les plus utilisées dans le monde sur Internet n’est africaine. Ce déséquilibre risque non seulement d’exclure plus d’un milliard de locuteurs des technologies émergentes, mais également de perpétuer des préjugés et des inexactitudes néfastes qui peuvent nuire à l’utilisation équitable des nouvelles technologies.
Soutenu par Google.org, le FCDO, le CRDI et la Fondation Gates, le nouveau projet vise à contrer cette tendance en garantissant que les technologies d’IA reposent sur des données précises, inclusives, culturellement pertinentes et provenant de sources éthiques.
Le Hub lance un appel à manifestation d'intérêt (EOI) sur trois piliers principaux :
- Reconnaissance automatique de la parole (ASR) : Données vocales à grande échelle et culturellement ancrées pour 18 langues africaines, mettant l'accent sur l'équilibre entre les sexes et l'authenticité contextuelle.
- Analyse comparative « Dans la nature » : Des études qui testent les performances réelles des modèles d’IA dans des contextes africains authentiques, pratiques et réels.
- Ensembles de données multimodales culturellement pertinentes : Des ensembles de données d'images, de textes et de parole de haute qualité pour 40 langues africaines pour alimenter la prochaine génération d'outils de traduction et d'éducation.
Les candidats retenus recevront un financement, une visibilité et un soutien institutionnel pour les aider à atteindre une croissance durable. Le partenariat avec le Masakhane African Languages Hub fournira également une plate-forme pour développer une technologie d’IA dirigée par l’Afrique et une inclusion pionnière pour les langues historiquement marginalisées dans la technologie.
L'objectif ultime est de doter un milliard d'Africains d'ici 2029 d'outils et de ressources d'IA pertinents au niveau local, ouvrant ainsi des opportunités de développement économique, d'innovation locale et de préservation du patrimoine linguistique de l'Afrique.
« Nous nous engageons à défendre l'innovation dirigée par l'Afrique qui garantit que l'IA reflète la riche diversité linguistique et culturelle du continent. Cet appel à propositions va au-delà de la construction de modèles ; c'est un mouvement vers un avenir numérique plus équitable. C'est une opportunité de centrer les groupes marginalisés tels que les femmes, les communautés rurales et les personnes âgées, de faire progresser la sagesse de nos aînés et d'incarner l'esprit d'Ubuntu. «
– Président Chenai, Directeur, Masakhane African Languages Hub