Один из самых распространенных языков коренных народов Канады теперь доступен в переводчике Google — впервые технологический гигант включил в свою платформу язык первых наций, метисов или инуитов.
Инуктут — широкий термин, охватывающий различные диалекты, на которых говорят инуиты в Канаде, Гренландии и на Аляске, — был добавлен в Google Translate, который переводит тексты, документы и веб-сайты с одного языка на другой.
Последнее дополнение является частью инициативы Google по разработке единой языковой модели искусственного интеллекта для поддержки 1000 самых распространенных языков в мире.
По данным Статистического управления Канады, в Канаде насчитывается около 40 000 носителей инуктута.
Читайте по теме:
Коренные народы Британской Колумбии в ярости после того, как правительство отменило план по защите пятнистой совы
12.10.2023
Бизнес в Ванкувере выиграл иск о диффамации из-за плохого отзыва в Google
04.10.2024
По словам Айзека Касвелла, старшего инженера-программиста платформы Google Translate, носителей какого-то языка недостаточно для того, чтобы определить, можно ли включить язык в Google Translate.
Для создания языковой модели необходимо также иметь достаточное количество текстовых данных в Интернете.
По словам Касвелла, для других языков коренных народов Канады «было слишком мало данных, чтобы можно было использовать модель машинного перевода».
Например, инженеры рассматривали возможность добавления языка кри, на котором говорят более 86 000 человек в Канаде, но у них было меньше веб-сайтов на этом языке, из которых можно было бы почерпнуть информацию.
При добавлении языка в Google Translate технологическая компания обращает внимание на две основные вещи: есть ли желание или потребность у сообщества и насколько это технически осуществимо.
После того как Google определила, что ее модель может распознавать инуктут, компания начала консультироваться с носителями языка и организациями.
Компания обратилась к Inuit Tapiriit Kanatami, национальной организации, представляющей около 70 000 инуитов в Канаде, чтобы убедиться, что разработка модели соответствует языку инуктут, включая возможность перевода обеих систем письма этого языка.
В инуктуте используется qaniujaaqpait, или слоговое письмо, и qaliujaaqpait, в котором используется латинский алфавит.
Организация приветствует работу Google по включению инуктута, ссылаясь на необходимость возрождения, защиты и продвижения инуитских языков.
«Добавление инуктута в столь широко используемую платформу дает инуитам возможность более полно взаимодействовать в цифровом мире, — говорится в заявлении Натана Обеда, президента организации Inuit Tapiriit Kanatami.
С появлением инуктута компания Google стремится стать более представительной для группы людей, которую часто игнорирует технологический сектор.
Комментарии