10 Nov 2008 18:55
Re: [Hunmorph] morphdb
Sári Márton <sarimarton <at> gmail.com>
2008-11-10 17:55:42 GMT
2008-11-10 17:55:42 GMT
2008/11/10 Peter Halacsy <peter <at> halacsy.com>
Nem értem, mit hittél róla, de nem hatástalan. Egy valamit elfelejtettem leírni. Az ocastem megprobalja karakterszámra a legrövidebb lemmát vagy épp a leghosszabb lemmát kiválasztani. Az az elképzelés, hogy egy-egy morféma növeli a szó hosszát. Ez egy hihetetlenül egyszerű megoldása annak, hogy valamikor agresszívan akarsz vágni, van, amikor nem.
On Nov 10, 2008, at 1:48 AM, Sári Márton wrote:
Köszi, így érthető, igen. Bár azt hittem, erre való a --stem-known longest/shortest/all kapcsoló (de úgy látom, ez is hatástalan).
a forradalmi szóval az a baj, hogy a forradalom pont ugyanolyan hosszú.
tehát az ocastem elegáns egyszerűsége hibázik.jól hangzik, bár nem értem. Az ocastem speciálisan kereső programokhoz készült. Azt akartam mondani, hogy ha megmondod mi a pontos alkalmazás, akkor talán tudok segíteni az ocamorph/ocastem testreszabásában. Az a tapasztalat, hogy szóelemzésre nincs általánosan mindenkinek jó megoldás.Egy keretrendszert fejlesztek, amiben a nyelvtan-/szótárfájlokat szkriptelni lehet, és a szkriptből pipe-pal hívogatni külső programokat, pl. szóelemzőt. Ehhez kezdtem el kísérletezgetni a hunspellel és az ocamorph-fal, így akadtam ezekbe a dolgokba
Nincs pontos alkalmazása, hiszen ez csak egy funkció (külső programok meghívása), amit a keretrendszer felajánl. Egy rövid leírás a projektről itt, ill. a csomagban, de ezt nyilván még rendbe kell szednem, mert nem könnyű a koncepciómat eladni. Első körben persze én is ilyen demoalkalmazásokra gondolok, amikben mondjuk van egy minimális szótár, és a nyelvtan a fel nem ismert szavakra rákeres a google-ban vagy egy szótárban, vagy a WP-n stb. (mondjuk szemantikai elemzéshez), ehhez meg jól jön egy stemmer.
Ezeknek az összeállításán vagyok most.
M
hp
_______________________________________________
hunmorph mailing list
hunmorph <at> lists.mokk.bme.hu
https://kelt.mokk.bme.hu/lists/mailman/listinfo/hunmorph
_______________________________________________ hunmorph mailing list hunmorph <at> lists.mokk.bme.hu https://kelt.mokk.bme.hu/lists/mailman/listinfo/hunmorph
RSS Feed