V súčasnosti nás obklopuje veľké množstvo textu v elektronickej podobe a inteligentná analýza textu je v dnešnej dobe veľmi zaujímavou témou v oblasti informačných technológií.
Analýza textu je rozklad textu v smere vytyčovanom kľúčovými intervenujúcimi významovými útvarmi.
Analýza textu je postupný rozklad textu ako prvotného, hotového celku na vety alebo iné základné časti, ktorý sa opiera predovšetkým o pojem funktora a pojem argumentu.
Za funktor sa pokladá vyjadrenie deja vyjadrenie deja, teda obyčajne sloveso, za argumenty sa pokladajú také okolnosti, ktoré sú viazané na sloveso a bez ktorých sloveso nemá plný význam.
Napr. sloveso rúbať vyžaduje, aby sa vyjadril pôvodca deja (kto rúbe, agens), ale aj predmet zasiahnutý dejom (čo je rúbané, patiens, objekt), sloveso rezať vyžaduje vyjadriť popri iných okolnostiach aj prostriedok, nástroj činnosti (čím sa reže, inštrument); sloveso darovať vyžaduje vyjadriť aj adresáta (komu sa daruje, datív).
…pre potreby analýzy textu možno použiť taký typ verbálneho predikátu, kde sa na sloveso (VERB) ako funktor viažu štyri základné elementy: agens, pôvodca deja (AGN), objekt nejako zasiahnutý, dotknutý dejom (OBJ), nástroj (INS) a adresát (ADR).
Pritom na verbálny predikát ako celok sa ešte viažu iné elementy, napr.
Ku každému argumentu (ba aj k funktoru) môžu pristúpiť určujúce, determinujúce prvky (DET) v podobe rozličných prívlastkov.
Prvým krokom pri analýze textu je postupné určenie všetkých funktorov a k nim patriacich argumentov.
Pri tomto kroku sa ukazuje niekoľko zaujímavých okolností: Nie všetky slovesá (funktory) majú obsahovú platnosť vo vzťahu k textu.
Také výrazy ako nazdávame sa, myslím, domnievam sa, ukazuje sa, vidieť, ako oznamuje TASS vlastne nepatria do myšlienkovej, hĺbkovej štruktúry textu ako správy o istej udalosti, lež vyjadrujú postoj, hodnotenie, komentár autora.
Ako funktory sa využívajú nielen slovesá v určitom tvare, ale aj prechodníky, príčastia, ba i slovesné podstatné mená.
Preto sa pri analýze rozkladajú všetky vety, polovetné väzby, rozvité prívlastky založené na slovenských tvaroch do osobitných viet, a teda posudzujú sa ako osobitné verbálne predikáty.
Pri ďalšom kroku je ešte možné a želateľné skúmať argumenty z hľadiska ich slovného vyjadrenia, napr. z hľadiska možnosti za konkrétne slovo dosadiť nejaké všeobecnejšie slovo, alebo naopak, celú skupinu synonymických slov.
Pri ďalšom základnom kroku, pri syntéze sa vlastne skúma, ako autor utvoril svoj text, ako realizoval hĺbkovú štruktúru, ktoré z ponúkaných možností využil.
Tu sa napr. kombináciou polovetnej konštrukcie, iný autor využil tri osobitné vety a pod.
Takisto možno zisťovať zásady výberu z radu synoným, ktoré má daný jazyk k dispozícii pre jednotlivé funktory a argumenty.
Napr. slovo spýtať sa má variant opýtať sa, ale aj položiť otázku.
Na označenie parlamentu v NSR možno použiť spojenie západonemecký parlament, snem, ale aj Spolkový snem, ba aj Bundestag.

Projekt TextMania vznikol ako odpoveď na problém nedostatku času manuálne analyzovať textové dokumenty, resp. pre potrebu analýzy textu v reálnom čase (segmentácia textu, detekcia tém, určovanie vhodnosti textu pre určité skupiny ľudí a podobne).
Nespornou výhodou je podpora slovenského textu, čím v podstate vypĺňa „dieru na trhu“.
Dnes už síce existujú nástroje zaoberajúce sa spracovaním a vizualizáciou textových dát, avšak žiaden z nich nie je vhodný pre texty v slovenskom jazyku a jeho špecifické črty (napr. rôzne tvary slov).
Cieľom projektu TextMania je vytvoriť prostredie pre inteligentnú analýzu textu napísaného v slovenskom jazyku.
Finálny produkt ponúkne možnosť importovať, analyzovať a automaticky spracovať články na základe ich obsahu pre rôzne úlohy klasifikácie textov či extrakcie čŕt.
Na začiatku získame vybrané články (podľa tématiky) zo stránok: wikipédia.sk a webnoviny.sk.
Následne ich označíme podľa kategórie, z ktorej boli stiahnuté a uložíme ich do databázy.
Ďalej sa vykoná lexikálna a syntaktická analýza vložených textov, aby bolo možné následne aplikovať požadované metódy strojového učenia pre identifikáciu entít v texte či klasifikáciu textu z rôznych hľadísk (napr. určenie témy alebo vhodnosti textu pre určitú vekovú skupinu ľudí).
Texty sa analyzujú pomocou pripravených metód spracovania prirodzeného jazyka, ktoré bude možné rozšíriť a vzájomne porovnávať.
Ďalej sa vytvorí napr. invertovaný index pre urýchlenie a zjednodušenie vyhľadávania v článkoch a korpusoch, čo tiež umožní identifikovať kroky použitých algoritmov v prípade potreby ich vylepšenia.

Naše webové riešenie poskytuje aj možnosť skúmať text formou hry, ktorá zobrazí používateľovi náhodne vybranú vetu z niektorého z článkov a používateľ má za úlohu vybrať prislúchajúci korpus a svoj výber podložiť stávkou z bodov (peňazí) pridelených na začiatku hry.
Touto formou vieme získať dodatočné dáta, ktoré môžu poslúžiť na vylepšenie použitých algoritmov.
Môže byť napríklad zaujímavé porovnávať dáta vypočítané „strojom“ s dátami od reálnych používateľov.
Náš tím pozostáva z 7 študentov prvého ročníka inžinierskeho štúdia na Slovenskej technickej univerzite - Fakulte informatiky a informačných technológií v Bratislave v odbore Inteligentné softvérové systémy.
Projekt Textmania je výsledkom spolupráce nasledujúcich členov tímu: Dávid Csomor, Adam Ďuriš, Alan Kováč, Daniel Kováč, Peter Križan, Patrik Melicherík, Krištof Orlovský.
Vedúcim projektu je Ing.
VIDEOMANUAL NA PROJEKTY A PROJEKTOVY MANAZMENT - AGENDA
Analýza textu vo všetkých svojich formách má vo vzdelávaní kľúčové miesto.
Tento proces zahŕňa dešifrovanie pozadia, štruktúry a významu slov na stránke.
Či už učíte o literárnom diele, historickom dokumente alebo vedeckom článku, schopnosť orientovať sa v tlačenom texte a dať mu zmysel je neoceniteľnou zručnosťou.
Grafický organizér na analýzu textu by slúžil ako cenný zdroj, ktorý by študentov previedol procesom pitvania prvkov textu a odhaľovaním jeho hlbšieho významu alebo vytváraním pútavej literárnej eseje.
Spravodajské články: Spravodajské články sa analyzujú z hľadiska zaujatosti, rámovania a novinárskych praktík.
Príspevky na sociálnych sieťach: Obsah sociálnych médií sa analyzuje z hľadiska sentimentu, trendov a verejnej mienky.
Toto je len niekoľko príkladov rôznych typov textov, ktoré môžu ťažiť z analýzy a demonštrujúc jej použiteľnosť v rôznych oblastiach a kontextoch.
Definujte cieľ: Určite špecifický cieľ analýzy, ako je kontextové skúmanie alebo analýza sentimentu.
Výber vhodných šablón: Vyberte si vhodný pracovný hárok na základe typu analýzy, ktorú chcete vykonať.
Navrhnite rozloženie: Štruktúrujte a načrtnite rozloženie logicky, začleňujte sekcie do úvodu, analýzy a záveru.
Vypracujte relevantné výzvy: Vytvorte výzvy a otázky, ktoré sú v súlade s vašimi cieľmi.
Začleniť analytické techniky: Zahrňte prvky, ktoré podporujú aplikáciu rôznych techník.
Zahrňte časť pre kontextovú analýzu: Ak vaša skúška zahŕňa pochopenie širšieho kontextu, uistite sa, že pracovný list obsahuje na to vyhradenú časť, kde môžu študenti písať odseky, ktoré informujú o ich kontextovom chápaní textu.
Podporujte citovanie textových dôkazov: Začleňte do pracovného listu priestory, kde si študenti môžu zaznamenať textové dôkazy zo zdrojového materiálu na podporu svojich zistení.
Prispôsobenie pre text alebo materiál: Prispôsobte pracovný hárok konkrétnemu textu alebo materiálu, ktorý sa analyzuje.
Vyvážte hĺbku a šírku: Dosiahnite rovnováhu medzi hĺbkou štúdia a šírkou pokrytia.
Na výber máme množstvo šablón.
Tu zahrniete pokyny, konkrétne obrázky a vykonáte akékoľvek estetické zmeny, ktoré by ste chceli.
Zatiaľ čo niektoré časti pracovného hárka analýzy textu môžu byť prispôsobiteľné, vo všeobecnosti je efektívnejšie prispôsobiť pracovný hárok špecifickým charakteristikám a cieľom typu textu.
Rôzne šablóny môžu byť vhodnejšie pre rôzne typy textu.
Áno, začlenenie textových odkazov je kľúčové pri zdôvodňovaní analýzy.
| Typ služby | Cena za preklad 1 NS (normostranu) | Poznámka |
|---|---|---|
| Preklad v bežnom termíne | Uvádza sa individuálne | Cena zahŕňa dodržanie pôvodnej grafickej úpravy a základnú korektúru pri prekladoch do slovenčiny. Minimálna účtovná jednotka je 1 NS. |
| Špecifické texty a dokumenty | Cena sa stanovuje individuálne | Vyžadujú náročnú grafickú úpravu alebo predtlačovú korektúru. |
| Preklady do iného cudzieho jazyka | Individuálna kalkulácia | Preklady z jedného cudzieho jazyka do druhého. |
| DTP a grafické práce | Cena sa stanovuje individuálne | Tabuľky, obrázky s popisom, grafy, rekonštrukcia formátu a rozloženia pri skenovaných dokumentoch, práca v Indesigne, Framemakeri. |
Všetky uvedené ceny sú bez DPH.
Cena je uvedená za preklad 1 normostrany zdrojového textu (NS) v bežnom termíne.
Cena zahŕňa dodržanie pôvodnej grafickej úpravy.
Pri prekladoch do slovenčiny je v cene zahrnutá aj základná korektúra.
Minimálna účtovná jednotka je 1 normostrana.
Pri špecifických textoch a dokumentoch, ktoré vyžadujú náročnú grafickú úpravu alebo predtlačovú korektúru, sa cena stanovuje individuálne (pozri nižšie).
* cena za preklad 1 NS (normostrany) výsledného textu.
Pri dokumentoch k autám (preklad technického preukazu, faktúry, odhlášky, kúpnej zmluvy) a jednoduchých štandardných dokumentoch (preklad diplomu, vysvedčenia, potvrdenia, rodného a sobášneho listu, výpisu z registra trestov) poskytujeme dodatočne individuálne zľavy.
Ak potrebujete preklad z jedného cudzieho jazyka do iného cudzieho jazyka, radi vám obratom vypracujeme kalkuláciu priamo na zvolený dokument.
Nemáte možnosť prísť si úradný preklad vyzdvihnúť osobne?
DTP a grafické práce (tabuľky, obrázky s popisom, grafy, rekonštrukcia formátu a rozloženia pri skenovaných dokumentoch, preklady v grafických formátoch...), práca v Indesigne, práca vo Framemakeri.
Zľava za charakter dokumentu - na často prekladané jednoduché formulárové dokumenty (napr.

tags: #analyza #a #rekonstrukcia #zdrojoveho #textu