Hirdetés
ì´ ì›¹ì‚¬ì´íŠ¸ì— 환ì˜. ì´ê²ƒì€ 보기 ì›ë³¸ì´ë‹¤
Milyen nyelv ez? Kínai? Japán?
Valójában koreai. Ennek manuális észlelése sok időbe telt volna. Szerencsére találtam néhány nagyon pontos eszközt, amelyek ezt automatikusan meg tudják tenni. Az alábbiakban mindegyiket felsoroljuk.
A kísérlet: A weboldalakat minta szöveggel (1-2 mondat 8 szóval) teszteltem a következő nyelvekből: portugál, orosz, koreai, vietnami, olasz, török, lengyel, ukrán, azerbajdzsáni, szlovén, macedón, holland, filippínó (tagalog), görög, galíciai, cseh, fehérorosz, finn, tatár és Norvég.
Összességében 20 különböző nyelvet teszteltem.
3 Eszközök az ismeretlen nyelvű szöveg észleléséhez
1. LangId (20 tesztből 18-at sikerült, tatárból és beloruszból nem ment át)

Előnyök: Összességében nagyszerű online eszköz. Alapvető szövegészlelési funkciókat kínál, és ezek is vannak Twitter és e-mail-észlelő robotok a még gyorsabb eredmények érdekében.
Hátrányok: Motorjuk a Google API-n alapul, de úgy tűnik, jobb eredményeket érnek el, mint az alább leírt Google detektor. Úgy tűnik, nagyon jól tudják használni a dolgokat. Nem tetszett, hogy nincs saját egyedi algoritmusuk a nyelvek észlelésére.
2. Google Nyelvérzékelő [Már nem elérhető] (20 tesztből 17-et teljesített, nem ment át portugálból, taglogból és fehéroroszból)

Előnyök: A Google rendelkezik a világ egyik legjobb nyelvfelismerési API-jával. Jó dolog az, hogy láthatja annak valószínűségét, hogy az általuk megjelenített eredmény igaz. A legtöbb mintavizsgálaton át tudták menni.
Hátrányok: Nagyon meglepődtem, hogy nem mentek át a portugál teszten. Úgy tűnik, van egy (remélem átmeneti) hibájuk ezzel a nyelvvel. Ezenkívül biztosan jobban tudnak dolgozni az oldal kialakításának javításában.
3. Milyen nyelv ez (20 tesztből 11-et teljesített, nem ment át orosz, koreai, ukrán, azerbajdzsáni, macedón, tagalog, görög, galíciai és tatár)

Előnyök: Egyes nyelvek, például a délszlávok (szerb, horvát, szlovén) meglehetősen hasonlóak. Ha mondjuk horvát szöveget ír be, ez a webhely azt fogja mondani, hogy a szöveg lehet szerb vagy szlovén is.
Hátrányok: Dolgozniuk kell az észlelési rendszerük kifinomultabbá tételén. Arra gondoltam, hogy felteszem Translated.net (egy másik webhely a nyelvészleléshez) e helyett, de a Translated több nyelv észlelését ígérte, és valójában rosszabbul teljesített, mint a WhatLanguageIsThis.com.
2 eszköz az ismeretlen nyelvű webhelyek észleléséhez
4. Google Fordító val vel Nyelvfelismerés első lehetőségként
Sikerült: 20-ból 18, fehérorosz és tatár nem ment át.
Előnyök: Ez az eszköz nagyon jól teszi a dolgát. Amiben tetszik Google Fordító A Google Fordító 2.1 natív iOS 7 billentyűzettel és további nyelvi támogatással jelenik megFrissítsen a Google Fordító 2.1-re iOS-eszközén, és vigye magával a fordítási és kézírási beviteli támogatást az új nyelveken. A Google Fordító végre új iOS 7-es billentyűzetet kapott, hogy minden... Olvass tovább az, hogy ha nem támogat egy adott nyelvet, akkor a következő képernyő jelenik meg:

Ez egy nagyszerű nyelvészlelő, ha engem kérdezel!
5. Microsoft Bing fordító val vel Auto felismerés első lehetőségként.

Sikerült: 20-ból 8 nem felelt meg a holland, vietnami, török, ukrán, azerbajdzsáni, szlovén, macedón, tagalog, görög, galíciai, cseh és fehérorosz nyelven
Előnyök: Korlátozott számú nyelvet támogat. Azoknál a nyelveknél jól teszi a dolgát.
Hátrányok: Nagyon csalódott vagyok a Microsoftban. Nagyon korlátozott számú nyelvük van az észleléshez és fordítás Felejtsd el a Google Fordítót: 3 módszer a pontos, gyors fordításhozFüggetlenül attól, hogy munkát vagy lakást keres külföldön, vagy le szeretné fordítani weboldalát, még egy idegen nyelven is rendbe kell jönnie. Olvass tovább és az Auto-Detect funkciójuk szörnyű. Ha olyan nyelvet ad meg, amelyet nem támogatnak, akkor rossz eredményt kap, ahelyett, hogy azt mondaná, hogy nem támogatja az adott nyelvet.
gondolatok
Összességében az a véleményem, hogy a fenti eszközök jó irányba haladnak. Jelenleg ezek a legjobbak a nyelvek online észlelésére, és elég jól végzik a munkájukat, ha a népszerű nyelvekről van szó. Dolgozniuk kell azonban még több homályos nyelv hozzáadásával (egyik eszköz sem tudta felismerni a tatárt), és biztos vagyok benne, hogy mindegyik, különösen a Google, a közeljövőben ebbe az irányba fog menni.
Kép jóváírása: Kanko*
A nevem Darko (beceneve Darren.) Szeretem a Web 2.0-t, niche webhelyeket készítek (legutóbbi projektem az emberek keresése) és így tovább...mi mást is mondhatnék rólam egy ilyen rövid profilban, kövess a Twitteren, ha többet szeretnél megtudni :)