Dabiskās valodas apstrāde (NLP) ir mākslīgā intelekta lauks, kas datoriem ļauj analizēt un saprast cilvēku valodu. Tā tika izstrādāta, lai izveidotu programmatūru, kas ģenerē un izprot dabiskās valodas, lai lietotājs varētu dabiski sarunāties ar savu datoru, nevis izmantojot programmēšanu vai mākslīgās valodas, piemēram, Java vai C.
Dabiskās valodas apstrādes (NLP) pārtraukšana
Dabiskās valodas apstrāde (NLP) ir viens solis lielākā misijā tehnoloģiju nozarē - proti, izmantot mākslīgo intelektu (AI), lai vienkāršotu pasaules darbību. Digitālā pasaule daudziem uzņēmumiem ir izrādījusies mainīga, jo arvien vairāk tehnoloģiju izmantojošie iedzīvotāji atrod jaunus veidus, kā tiešsaistē mijiedarboties savā starpā un ar uzņēmumiem. Sociālie mediji ir no jauna nodefinējuši kopienas nozīmi; kriptovalūta ir mainījusi digitālā maksājuma normu; e-komercija ir radījusi jaunu vārda ērtības nozīmi, un mākoņu krātuve masām ir ieviesusi citu datu saglabāšanas līmeni.
Izmantojot AI, tādas jomas kā mašīnmācība un dziļa mācīšanās paver acis uz visu iespēju pasauli. Mašīnmācīšanās arvien vairāk tiek izmantota datu analītikā, lai izprastu lielos datus. To izmanto arī, lai programmētu tērzēšanas robotus, lai modelētu cilvēku sarunas ar klientiem. Tomēr šie mašīnmācības priekšnoteikumi nebūtu iespējami bez dabiskās valodas apstrādes (NLP) improvizācijas.
Kā NLP faktiski darbojas?
NLP apvieno AI ar skaitļošanas valodniecību un datorzinātnēm, lai apstrādātu cilvēku vai dabiskās valodas un runu. Procesu var sadalīt trīs daļās. Pirmais NLP uzdevums ir saprast dabisko valodu, ko saņem dators. Dators izmanto iebūvētu statistisko modeli, lai veiktu runas atpazīšanas rutīnu, kas dabisko valodu pārveido programmēšanas valodā. Tas tiek darīts, sadalot neseno runu, kuru dzird, sīkās vienībās, un pēc tam salīdzina šīs vienības ar iepriekšējām runām no iepriekšējās runas. Izeja vai rezultāts teksta formātā statistiski nosaka vārdus un teikumus, kas, visticamāk, tika pateikti. Šo pirmo uzdevumu sauc par runas-teksta procesu.
Nākamais uzdevums tiek saukts par runas daļas (POS) marķēšanu vai vārdu kategorijas atdalīšanu. Šis process parasti identificē vārdus to gramatiskajā formā kā lietvārdi, darbības vārdi, īpašības vārdi, pagātnes laiki utt., Izmantojot datorā kodētu leksikona noteikumu kopumu. Pēc šiem diviem procesiem dators, iespējams, tagad saprot runas nozīmi.
Trešais solis, ko veic NLP, ir teksta pārveidošana runā par runu. Šajā posmā datorprogrammēšanas valoda lietotājam tiek pārveidota skaņas vai tekstuālā formātā. Piemēram, finanšu ziņu tērzētavā, kurai tiek uzdots tāds jautājums kā “Kā Google darbojas šodien?”, Visticamāk, skenēs tiešsaistes krājuma vietnes Google krājumos un, iespējams, nolems kā atbildi izvēlēties tikai tādu informāciju kā cenu un apjomu.
NLP mēģina padarīt datorus saprātīgus, liekot cilvēkiem uzskatīt, ka viņi mijiedarbojas ar citu cilvēku. Tēringa tests, ko 1950. gadā ierosināja Alans Turings, nosaka, ka dators var būt pilnībā saprātīgs, ja tas spēj domāt un veidot sarunu kā cilvēks, pat ja cilvēks nezina, ka sarunājas ar mašīnu. Pagaidām testu ir izturējis tikai viens dators - tērzētava ar 13 gadus veca zēna personību. Tas nenozīmē, ka inteliģentu mašīnu nav iespējams uzbūvēt, taču tajā ir aprakstītas grūtības, kas saistītas ar datora piespiešanu domāt vai sarunāties kā cilvēkam. Tā kā vārdus var izmantot dažādos kontekstos un mašīnām nav tādas reālās dzīves pieredzes, kāda ir cilvēkiem, lai izteiktu un aprakstītu entītijas vārdos, var paiet nedaudz laika, līdz pasaule var pilnībā atbrīvoties no programmēšanas valodas.
