Senso Comune

Soci:Forma

Da Senso Comune.

(Redirect da Forma)

Indice

Discussione del modello di Senso Comune

La base di conoscenza di Senso Comune si basa su un modello capace di rappresentare e integrare informazione di carattere linguistico e ontologico. Il modello è in corso di definizione e si basa sul linguaggio di modellazione UML. L'accesso alle pagine di discussione riservato ai Soci.

Draft dei modelli di Senso Comune

Modelli esistenti

WordNet

Wordnet è un database lessicale della lingua inglese sviluppato presso l'Università di Princeton sotto la direzione di George Miller. I lemmi sono raggruppati in insiemi di sinonimi cognitivi (synset), legati tra loro mediante relazioni lessicali, concettuali e semantiche.

Una modellazione del database Wordnet è proposta da Michael Daconta sotto forma di schema XML. Questa è un diagramma UML che mostra il modello concettuale dello schema:
 Modello UML dello schema di WordNet secondo Michael Daconta

Ecco un esempio di come, mediante questo schema, viene rappresentata un'entrata lessicale con i suoi sensi.

<wn:Word xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#'
                 xmlns:wn='http://www.daconta.net/wn#'
                 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
                 xsi:schemaLocation="http://www.daconta.net/wn# Word.xsd"
                 rdf:ID='dog' >
   <wn:partsOfSpeech rdf:parseType='Collection'>
       <wn:PartOfSpeech wn:type='verb'>
          <wn:concepts rdf:parseType='Collection'>
             <wn:Concept rdf:ID='_1943890'>
                   <wn:definition>go after with the intent to catch; 
                   "The policeman chased the mugger down the alley"; 
                   "the dog chased the rabbit"</wn:definition>
                   <wn:relations  rdf:parseType='Collection'>
                        <wn:Relation wn:type='hypernym' wn:tgt='_1942900'/> ...
                        <wn:Relation wn:type='hyponym' wn:tgt='_1946245'/>
                  </wn:relations>
                  <wn:synonyms rdf:parseType='Collection'>
                        <wn:Synonym wn:lemma='chase_after'/>
                        <wn:Synonym wn:lemma='give_chase'/>
                 </wn:synonyms>
              </wn:Concept>
         </wn:concepts>
      </wn:PartOfSpeech> ...
</wn:Word>
 

FrameNet

Proposte

LC STAR

Lo scopo del progetto Lexica and Corpora for Speech-to-Speech Translation Components (LC STAR) è quello di creare un lessico per 13 lingue e dei corpora testuali annotati per 3 lingue.

Tra i documenti pubblici, è rilevante il D2.3 (Definition of representation format).

Il formato di rappresentazione XML adottato segue un modello espresso in questo DTD.

Lexical Markup Framework

Iniziativa per lo sviluppo di uno standard internazionale ISO per lessici computazionali mono e multilingui. Vedi pagine presso INRIA.

 Gil Francopoulo et al. Lexical markup framework (LMF) for NLP multilingual resources, COLING / ACL 2006

MediaWiki