неделя, юли 3, 2022

Facebook многоезичен машинен превод M2M-100

Какво е M2M-100?

Facebook в края на 2020 представи собствен софтуер, базиран на AI модел, който според компанията е първият, който превежда от 100 езика, без да разчита на английския като междинна стъпка. Софтуерът за изкуствен интелект с отворен код е създаден, за да предостави възможност на социалната мрежа да достави съдържание на потребителите си по целия свят които надминават два милиарда души.

Изкуствения интелект на Фейсбук с кодово име M2M-100 беше обучен с данни от 8 милиарда двойки изречения от 100 различни езика. Понеже системата за езикови преводи не използва английския език като междинна стъпка, както останалите конкурентни други, това позволява на софтуера да достига почти 90 процента точност в превода.

Как работи FB преводачът с изкуствен интелект?

Досега когато искахме да преведем нещо от гръцки на български език, предишните онлайн преводачи като Google Translate, Bing Translator или Яндекс Переводчик използваха английската база тъй като данните за обучение на английски език са най-широко разпространени. Новият FB модел се обучава директно върху данни за превод от български на гръцки език, за да се запази по-добре смисъла.

Естествено че все още машинния превод не може да замести оригиналния превод от професионален преводач и ако искате да получите официален превод на документи ще трябва да потърсите агенция за преводи и легализация на документи която да направи преводи на гръцки на Вашите официални документи и да ги легализира за чужбина.

M2M-100 е обучен върху общо 2200 езикови направления – или 10 пъти повече от предишните най-добри, англоцентрични многоезични модели. Внедряването на M2M-100 ще подобри качеството на преводите за милиарди хора, особено за тези, които говорят езици с нисък ресурс.

Към гореизброените 3 онлайн преводача бих добавил и Deepl translator с платения план advance който позволява по-добър машинен превод на документи с помощта на CAT софтуер (computer aided translation tools) с (преводаческа памет-ТМ).

Преодоляването на езиковите бариери чрез машинен превод ще отвори нови възможности на хората по света да разберат една различна култура и ще им даде възможност да се докоснат до неща разбираеми само от местните.

Какви технологии използва M2M-100

Всеки език, който трябва да бъде преведен, първо се разбива на малки думи, наречени токени. За превода системата получава и дава токени съответно като вход и изход. Базирането на превода на думи като единици обаче може да се окаже предизвикателство в процеса на многоезичен превод, тъй като води до речници с лошо покритие.

Друг проблем е, че в много езици има думи, които не могат да бъдат разбити като единични думи. Затова моделът за многоезичен превод използва процес на токенизация на подслововете, за да създаде последователност от токени като вход и изход за машината. Освен това този модел за многоезичен превод се основава на архитектурата Transformer sequence-to-sequence (последователност към последователност), която се състои от два модула:

  1. Енкодерът приема последователността от думите на изходния език и я трансформира в последователност от подсловови думи със същата дължина, които се вграждат в декодера.
  2. Декодерът, вграден в последователността от думи, я декодира, като я трансформира в последователност на целевия език и по този начин след това се произвежда целевия език.

 

M2M-100 – многоезичен модел за машинен превод (MMT)

Най-хубавото на М2М-100 е, че „разбира“ информацията от сродни езици и отразява разнообразната писменост на езиците плюс морфологията като модела е с отворен код и изследователите могат да работят по-неговото усъвършенстване.

AI в помощ на новите дигитални предприемачи

Изкуствения интелект навлиза все повече в обикновения живот и създава условия за създаване на общност от дигитални предприемачи които ще създават бизнес и ще управляват риска много по-ефективно и целесъобразно. ИКТ (информационни и комуникационни технологии) иновациите са основният фактор за развитие на бизнеса и основната движеща сила на съвременната индустрия и предпоставка за нейната висока производителност и конкурентоспособност. Колкото една икономика е по-иновативна и ориентирана към използването на ИКТ, толкова е по-вероятно тя да е и по-конкурентна.

Подобни публикации

Коментарите са затворени.

Този уебсайт използва бисквитки за да подобри вашето пребиваване на него. Приемам Научете повече