A beszélt és írott nyelv informatikai feldolgozása

from Csak POZITÍVAN Magazin 2021/08

Kávészünet az elmének

A beszélt és írott nyelv informatikai feldolgozása

A beszélt és írott magyar szöveg feldolgozását lehetővé tevő - informatikában használatos - nyelvi modellt hoztak létre a Pécsi Tudományegyetemen (PTE) a Microsoft technológiájának segítségével.

Mindenki szívesebben használja az anyanyelvét chat és más automatizált alkalmazásokban, mivel azonban a magyar nyelvet viszonylag kevesen beszélik, a cégek számára gyakran nem éri meg kifejleszteni a feldolgozásához szükséges szoftvereket. Ez indokolta a fejlesztést. A PTE Alkalmazott Adattudományi és Mesterséges Intelligencia csapata felismerte ezt a problémát, és a nagy mennyiségű magyar nyelvű adat kezelését megkönnyítendő természetes nyelvfeldolgozási módszerek kutatásába fogott. A megoldást egy magyar nyelvű, úgynevezett „BERT” modell létrehozása jelentette.

A BERT a Google órásvállalat egyik nyílt forráskódú technológiája, amely a természetes nyelvfeldolgozását hivatott segíteni. Az új modell - amelyet a PTE munkatársai kevesebb, mint 200 munkaóra és 1000 euró befektetéssel hoztak létre - segíti a számítógépet a többféleképpen értelmezhető szövegrészek megértésében oly módon, hogy a szövegkörnyezetből kontextust épít. A modell működéséhez legalább 3,5 milliárd szót tartalmazó folyószöveg szükséges. Ezt az adatbázist a Nyelvtudományi Kutatóközpont, a projekt másik résztvevője többek között a Magyar Nemzeti Szótárból, online médiatárakból és az opensubtitles.org ingyenesen hozzáférhető filmfelirat-adatbázis magyar nyelvű anyagai közül gyűjtötte. A csapat a vállalat által fejlesztett Microsoft Azure mesterséges intelligenciáját és a ONNX Runtime gépi tanulási modellekhez készült, nagy teljesítményű következtető motort használta.

A PTE számára kulcsfontosságú terület lett a mesterséges intelligencia és a felhőalapú oktatás, amióta a Microsoft Mesterséges Intelligencia Tudásközpont program keretein belül partnerkapcsolatot épített ki az intézmény az informatikai vállalattal 2019-ben.

Eddig a legtöbb, 102 trópusi vihar volt tavaly világszerte

Az átlagosnál jóval több, 102 trópusi vihar volt tavaly világszerte az Amerikai Óceán-és Légkörkutató Központ (NOAA) éves jelentése szerint.

Az északi és déli féltekén feljegyzett 102 trópusi vihar száma jóval meghaladja az 1981-2010 között évente jegyzett mintegy 85-öt.

A 2020-as atlanti-óceáni trópusi szezonban a tudósok rekordszámú, kereken 30 vihart regisztráltak. Eddig 2005-ben jegyezték fel a térségben a legtöbb, 28 trópusi vihart a NOAA szerint.

Hét hármas kategóriájú vagy annál nagyobb vihar söpört végig az Atlanti-óceánon, ezek egyike a négyes kategóriájú Iota hurrikán volt, amely meglepte a meteorológusokat azzal, hogy novemberben alakult ki, ami igen ritka, hiszen ekkor az óceán vize már hűlni kezd, ez a hurrikánszezon vége.

Történelmi rekordot döntött az is, hogy 12 trópusi vihar érte el a szárazföldet az Egyesült Államok partjainál, korábban ez a szám kilenc volt.

Ezzel szemben a Csendes-óceán északi részén tavaly nem volt rekordszámú vihar, de a kutatók feljegyeztek egy szuper tájfunt, a Gonit, amely miatt mintegy egymillió embert kellett kimenekíteni otthonából a Fülöp-szigeteken.

A trópusi viharok rekordszáma mellett a kutatók szerint a tavalyi év azon három év között volt, amikor a globális földfelszíni hőmérséklet rekordmértékűre melegedett az 1800-as évek közepe óta. Ráadásul ez úgy következett be, hogy nem alakult ki az el Nino jelenség melegítő hatása.

A beszélt és írott nyelv informatikai feldolgozása

Next Article

Kávészünet az elmének

A beszélt és írott magyar szöveg feldolgozását lehetővé tevő - informatikában használatos - nyelvi modellt hoztak létre a Pécsi Tudományegyetemen (PTE) a Microsoft technológiájának segítségével.

Az átlagosnál jóval több, 102 trópusi vihar volt tavaly világszerte az Amerikai Óceán-és Légkörkutató Központ (NOAA) éves jelentése szerint.

Az északi és déli féltekén feljegyzett 102 trópusi vihar száma jóval meghaladja az 1981-2010 között évente jegyzett mintegy 85-öt.

More articles from this publication:

Kávészünet az elmének

Vissza a munkás hétköznapokba, szeptemberi csillag-kitekintő

Az én olimpiám

LÁNGOLÓ FŐNIX

A gyengédségben rejlő erő, az erőben rejlő gyengédség

A CSEND

Lehet másképp 8

Véletlen vagy sors?

Mentális betegeket fenyeget a légszennyezettség

This article is from:

Csak POZITÍVAN Magazin 2021/08