Arxiu de la categoria: segmentació textual

Semblances documentals (5).

En el darrer apunt d’aquesta sèrie, havíem vist com el mètode de transformar les paraules dels documents altmedievals a una forma simplificada, per tot seguit esmicolar la versió dels texts resultant en grups d’entre 3 i 40 paraules consecutives, permetia … Continua llegint

Publicat dins de Alvèrnia, aprenentage no supervisat, aprenentage supervisat, Aquitània, Borgonya, cadenes de Màrkov, cathalaunia.org, classificadors estadístics, detecció de formularis, estadística, Fons Cathalaunia, formularis, Gòtia, Gephi, Llemosí, Lluís el Cec, Mocorono, Odó I, Revellus, Roergue, segmentació textual, semblança documental, Semblances interdocumentals, SVG, Terrassa, Vallfogona | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , | Deixa un comentari

Semblances documentals (4).

En el tercer apunt d’aquesta sèrie, s’havia comentat el darrer càlcul realitzat per mirar de trobar un procediment de segmentació de documents altmedievals que basat exclusivament en criteris quantitatius, produís idealment uns resultats similars als de la segmentació manual, basada … Continua llegint

Publicat dins de cathalaunia.org, estadística, Fons Cathalaunia, segmentació textual, semblança documental, Semblances interdocumentals | Etiquetat com a , , , , , | Deixa un comentari

Undila comte d’Empúries? O de les dificultats de la prosopografia.

Actualment, s’està processant l’any 891 en el Fons Cathalaunia, i un dels documents recentment incorporats, permet il·lustrar les dificultats que sovint comporta l’establiment d’una prosopografia bàsica – en l’aspecte de la identificació de les persones esmentades en els texts -, … Continua llegint

Publicat dins de Anna, Bàscara, Brunequilda, cerca per lemes, Crucilias, Delà, expressions regulars, Felcariolas, Fons Cathalaunia, Gabriel Roura i Güibas, Girona, Guifré, Ihilo, Kintila, Liciniano, lista de documents compartits, Narbona, Odó I, prosopografia, Quintol, Ramon Martí, segmentació textual, Selector, Stephanus, Sunyer, Throannus, Ullà, Uncategorized, Undila, Wicfridum, Wigo | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | 2 comentaris

Semblances documentals (3).

Aquest és un apunt de situació, no per presentar resultats, sinó per parlar del que s’està explorant en el camp del còmput de semblances interdocumentals en texts de l’alta edat mitjana. El dos primers apunts d’aquesta sèrie, ja van presentar … Continua llegint

Publicat dins de cathalaunia.org, estadística, Fons Cathalaunia, formularis, lematització, segmentació textual, semblança documental, Semblances interdocumentals | Etiquetat com a , , , , , , , | Deixa un comentari

Semblances documentals (2).

Continuem aquí el tema de les semblances documentals que vàrem encetar fa uns dies. El que farem primer, serà provar una aproximació diferent als resultats de comparar entre si els 728 documents que formaven part del Fons Cathalaunia quan es … Continua llegint

Publicat dins de Adalardus i Deodata, Beaulieu, Benedictus, Brioude, Carles el Simple, cathalaunia.org, Cluny, Conques, detecció de formularis, distància documental, estadística, Fons Cathalaunia, formularis, Fulquerius i Raimodis, Gòtia, Gephi, Gescafredi, Guifré Pilós, Guifré-Borrell, Lluís el Cec, Lluís el Tartamut, Luitprand, Marteses, Nimes, Otger Cataló, Sant Vicenç, segmentació textual, semblança documental, Serfdedéu, Sunyer, Ucbertus | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | 2 comentaris

Antroponímia, lematització i mesures de semblança documental.

Aquest apunt no deixa de ser una petició d’ajut filològic. Encara no fa un parell de mesos que en una entrada anterior havíem explicat que el Selector del Fons Cathalaunia havia rebut una nova eina per el treball prosopogràfic: la … Continua llegint

Publicat dins de antroponímia, cathalaunia.org, cerca lematitzada, detecció de formularis, distància documental, estadística, filologia llatina medieval, Fons Cathalaunia, Gelsindus, grup antroponímic, Jordi Bolòs i Masclans, Josep Moran i Ocerinjauregui, lematització, Repertori d'Antropònims Catalans (RAC), segmentació textual, semblança documental | Etiquetat com a , , , , , , , , , , , , , , , | Deixa un comentari