Semblances documentals (2).

Continuem aquí el tema de les semblances documentals que vàrem encetar fa uns dies. El que farem primer, serà provar una aproximació diferent als resultats de comparar entre si els 728 documents que formaven part del Fons Cathalaunia quan es va realitzar el còmput. Si en el primer apunt havíem anat agrupant els documents que tinguessin entre sí un cert grau mínim de semblança i visualitzar-ne els diferents conjunts que es formaven segons s’anava ampliant aquest grau, aquest cop, el que farem serà mirar quins documents són més propers a quins altres.

Per defecte, les convencions emprades en els grafs que seguiran són les mateixes que en l’apunt inicial, l’únic canvi, en aquesta sèrie, serà que la mida dels nodes no reflectirà el nombre de fragments del document sinó el seu grau de centralitat topològica (modalitat Intermediació). Atès que la voluntat en fer aquests grafs està més centrada en mostrar i/o examinar la interrelació dels documents segons la seva semblança, s’ha pensat més adequat visualitzar amb nodes més grans els que facin de ‘pont’ entre els diferents grups, que és el concepte que la Intermediació captura.

Així que comencem per visualitzar per cada document, quins 2 altres texts s’hi assemblen més:

docs728-2-th

686 Texts enllaçats amb els 2 altres documents més semblants.

A diferència dels grafs primers, cal recordar, que en aquests grafs no hi ha un grau mínim de semblança a complir, de manera les connexions entre documents són relatives, no absolutes, i per tant, no han d’originar-se en graus de semblança especialment alts.  El graf resultant, conté tots els documents del Fons que presenten text ‘original’ (en llatí) – 686 dels 728 – gairebé tots ells connectats entre si; gairebé, que no tots.

Hi han fins a tres petites ‘illes’. La de la part superior, està formada per butlles papals, la de la part dreta, per el conjunt de quatre entrades que registren uns documents notarials fets en motiu de la pèrdua dels originals, que com es pot veure en aquest graf, en el seu context nadiu, podríem pensar que serien ben probablement poc habituals (en termes relatius); i el darrer grup aïllat, en la part inferior de graf, que està format per les entrades dels annals ripollencs que descriuen la mort del Pilós i/o el seu fill Guifré-Borrell.

Ara bé, si passem al grup majoritari, es pot observar, seguint la coloració dels nodes segons localització, com els documents d’Aquitània, formen (a semblança del què vèiem en l’apunt anterior) tres grups propis (Beaulieu, Conques i Brioude), fàcilment identificables i separats de l’amàs central. Quelcom semblant ho trobem per el que fa als documents de Borgonya, que majoritàriament es concentren en un únic grup en la part inferior, si bé en aquest cas, s’aprecia un cert grau d’influència provençal. L’amàs central concentra els documents de la Gòtia, però també es pot percebre una clara influència provençal i un no petit grau d’interrelació amb la resta de localitzacions (per exemple, el node amb un grau major d’Interrelació, en el bell mig del grup gòtic, no és altra que la Vita Geraldi, text que en ser comparativament força extens, proporciona moltes possibilitats de semblança (encara que siguin parcials i de molt baix coeficient) a la resta d’entrades.

També s’aprecien una sèrie de lligams força curiosos, i que difícilment serien detectables a ull nu. Per exemple, en la part dreta del graf, veiem com des de la làpida de Servusdei, bisbe de Girona, o la del monjo Gescafredi a Barcelona, podem passar a un conjunt d’entrades dels annals de Ripoll sobre inicis de papats, i d’aquestes, via dues làpides barcelonines, passar a un conjunt d’entrades del cronicó de Luitprand de Cremona, que ens porten al relat de la translació de les restes de Sant Vicenç a Itàlia per finalment arribar a la estratègicament central Vita Geraldi. O en el quadrat sud-oest, una alineació ben inesperada: des de l’epitafi d’Otger Cataló, passar al poema dedicat a la mort de Sant Grau, per d’aquí anar l’epitafi de Guifré-Borrell a Sant Pau del Camp, a Barcelona, i d’aquest, al del comte Sunyer a Roses, per finalment arribar a un cul de sac format per la Vita Theodardi, el fals de la consagració de la Seu d’Urgell, i el precepte de Carlemagne al seu fidel Joan.

Però si bé aquests lligams es poden considerar gairebé anecdòtics, altra cosa són les sub-agrupacions que també es poden apreciar fàcilment. Per exemple, la dels documents gòtics en el centre del quadrant sud-oest, formada majoritàriament per les consagracions del bisbe d’Urgell, Nantigis, o la que en el quadrant sud-est presenta una sèrie de regests de documentació gòtica que enllaça amb una sèrie de regests provençals. En un cas tenim una agrupació clarament protocol·laria, i en l’altre, una de purament formal. També se’n pot detectar fàcilment una altra en el quadrant nord-oest, on s’observa una agrupació mixta, majoritàriament de documents gòtic i aquitans, on hi trobem entre altres, els preceptes reials francs. Els preceptes de Lluís el Cec, però es concentren el el quadrant nord-est, just damunt del node la Vita Geraldi.

Podem també detectar les sub-agrupacions del graf analitzant la topologia d’aquestes connexions, independentment per tant de les seves possibles representacions; el que és coneix com Modularitat. Si mirem de detectar els grans grups, podem pintar el mateix graf amb uns codis de colors (que no tenen res a veure amb els de la localització) que ens ho indiquin:

docs728-2m-th

Les 8 agrupacions topològiques dels 686 Documents enllaçats als 2 altres que els hi són mes propers.

Graf que resulta força interessant, entre altres coses, perquè ens mostra la unitat topològica entre els sub-grups aquitans, i l’esfilagarsada, però nogensmenys notable relació entre els diplomes de Lluís el Cec i els dels reis francs que ja s’havia manifestat en la mirada global del darrer apunt.

Provem ara a incrementar a 5 el nombre d’enllaços per document:

docs728-5-th

686 Documents enllaçats als 5 altres documents més semblants.

L’increment del nombre de lligams, lluny de desdibuixar les agrupacions, més aviat les potència. En la part més dretana, tenim els dos grups de preceptes, els francs i els provençals, com abans, separats de la resta de testimonis i amb clares semblances entre ells. En l’extrem nord, tenim una agrupació de documents majoritàriament de Borgonya però amb una presència no menor de texts provençals; la font documental més comú del grup: el Recueil des Chartes de l’Abbaye de Cluny. La triple agrupació aquitana, també és ben patent. En el sud-oest, tenim el gran amàs de la documentació gòtica i en el centre, una àrea ‘esponjosa’ de documentació majoritàriament gòtica (amb una preponderància de regests) , si bé amb aportacions de gaire bé totes les altres localitzacions; quelcom com una ‘terra de ningú’ documental, ja que també hi troben les entrades més narratives i hagiogràfiques del Fons.

Ara, una mirada més apropada també ens descobreix una sèrie de documents aparentment ‘fora de lloc’, que són per això mateix especialment interessants; per exemple: en el bell mig de l’agrupació aquitana de les donacions a Sant Julià de Brioude (la de més a la dreta), hi trobem un document d’Avinyó, força especial, ja que es tracta d’una dotació matrimonial de terres provençals (de Fulquerius a Raimodis) segons la llei romana. Com també resulta oportú fer notar la situació d’una venda de terres aquitanes en la part baixa de l’amàs borgonyó, que inspeccionat, mostra certament trets més borgonyons que no pas aquitans. O la venda de terres que feta a Nimes es situa en l’interior del gran amàs dels documents de la Gòtia. També resulta prou clar l’agrupació dels documents pallaresos, en la part superior dreta d’aquest mateix amàs; el que ja resulta més sorprenent és com es veu rodejat (que no barrejat) amb un seguit de documents provençals (gaire bé tots localitzats a Nimes) que s’enllacen amb el gran grup gòtic. Quelcom certament poc previsible.

Podem fer encara un lligam més ampli i provar d’enllaçar cada text amb els 10 documents que més assemblin (el graf generat ja sobrepassa el 5.000 enllaços):

docs728-10-th

868 Documents enllaçats als 10 altres documents més semblants.

El resultat però, més enllà de repetir les agrupacions del graf fet amb 5 enllaços per document,  tant sols aporta potser una millor estructuració de la part central, però no sembla afegir-hi res d’especialment significatiu.

Fins aquí aquest primer tast de les agrupacions de documents per grau de semblança, però al darrera d’aquestes semblances, es troben les dels fragments que composen els texts (i ja hem vist en l’apunt previ com s’articulava el còmput a partir d’elles), així que potser que provem de fer un cop d’ull a quins fragments s’assemblen a quins altres.

Detecció de formulacions

Si dels 728 documents originals, en teníem 686 amb text, aquests 686 estan subdividits internament en un totals de 8.587 fragments, i per a cada un d’ells en tenim el grau de semblança amb la resta. Si feu el números, veureu que són més de 32 milions de valors, així que de nou, el repte és com analitzar aquest volum de coeficients, i ja que estem utilitzant grafs, mirar com disposar visualitzacions que siguin útils. Si consideréssim els fragments aïlladament, i els connectéssim per el seu grau de semblança, certament les agrupacions que es formessin, indicarien les diferents ‘frases’ més compartides en el Fons, però ens trobaríem amb que la informació d’un document estaria disseminada per tot el graf, així que per mirar d’evitar aquesta dispersió, inicialment, a més dels nodes corresponents a cada un del fragments existents, s’han incorporat també nodes de documents, que s’enllacin amb cada un dels seus propis fragments. Però certament, això destorbarà les agrupacions dels fragments per grau de semblança, ja que si fem que els lligams dels fragments amb el seu documents siguin molt fluixos, els nodes se’n separaran i estarem de facto en l’escenari d’uns fragments dispersos que volíem a priori evitar, però si el lligam és massa fort, inevitablement distorsionarà, la mateixa agrupació dels fragments, que és el que més ens interessa, de manera que tenim un escenari complicat.

El que primerament s’ha fet, a semblança del que vàrem fer primer amb els documents, és mirar de visualitzar només els fragments que presentin un grau de semblança per damunt d’un cert valor prefixat, i en aquests casos, fer que la connexió entre els nodes dels fragments i els dels seus documents, tinguin com a força, aquest mateix valor de tall, és a dir, siguin del valor mínim acceptat. A diferència dels altres grafs, en visualitzar els fragments, s’ha optat per utilitzar la mida dels nodes per indicar (apart del l’etiqueta) si són fragments o són documents:  els fragments són doncs el nodes petits i els documents, els grans. Per el que fa a la resta, es segueixen les mateixes convencions que s’han emprat fins ara.

Sí cal recordar, que en ser grafs força més  grans, alguns ordenadors poden tenir problemes en la navegació dins del graf (a partir del fitxers SVG enllaçats a les imatges), i que tal i com ja es feia, clicant sobre els nodes del documents s’obrirà el document en qüestió, i fent-ho sobre el nodes de fragment, intentarà posicionar-ne directament en el fragment del text elegit. Això es possible, perquè les segmentacions emprades es reflecteixen en el codi html de les pàgines de documents del web en forma d’ancoratges (anchors en la terminologia original), de manera que si teniu un navegador que tingui l’opció de fer-els visibles (per defecte no ho són[1]) , es poden apreciar directament (són els que comencen per ‘#f’).

Comencem per fixar un valor de tall alt, de 0.7:

fragw728-7-th

1.555 fragments amb 7.225 enllaços amb un grau de semblança >= 0.7.

El graf resultant, és certament complex, i de lectura no massa evident. Recordem que els nodes petits són els fragments, de manera que el que estem buscant, bàsicament són les seves agrupacions… I d’això en tenim, i força; el que passa és que el graf té tants nodes que mirant d’evitar la seva superposició, s’han produït aquestes formes globulars i una dispersió tal vegada excessiva, però tot i així, les agrupacions de fragments són fàcilment perceptibles.

Comencem per l’agrupació major de fragments gòtics. En la part superior, tenim un amàs en forma de bola separat de la resta que no és altra cosa que els fragments introductoris ‘In nomine Domini‘. Cas especialment il·lustratiu dels problemes derivats d’una manca de metodologia rigorosa en la segmentació dels texts, ja que aquest amàs, ens recull els documents en què aquesta frase introductòria ha estat segmentada a part, que no són pas tots, ja que en altres s’ha deixat com a prefaci de la primera sentència del text.

Just a sota, però ja dins l’amàs gòtic global, en tenim una altra un xic mes difusa (i que per tant indica un major grau de variació interna), analitzat manualment – i aquí és on encara es fa més patent la necessitat de disposar el més aviat possible d’una eina de visualització dels fragments repetits dels texts (les fórmules dels formularis) – tenim que es tracta de les sentències tipus: ‘X presbiter , qui hanc karta vindicionis scripsi … sub die et anno quod supra‘, les variacions al voltant d’aquesta fórmula es troben en l’àrea contigua a aquesta agrupació.

Encara en el grup gòtic, en la banda esquerra, en tenim una altra; es tracta de les datacions en format: ‘Facta karta vinditionis …  anno … regnante Karlo rege filio Leodevicho‘. Agrupació que es comunica amb una altra, externa al grup principal, formada per la mateixa sentència però recollida en regests: ‘Anno … regnante Karulo rege , filio Ludovici‘.

Just a sota d’aquesta agrupació n’hi ha una altra propera que resulta més interessant, ja que es comparteix entre documents gòtics i aquitans, i és el primer exemple d’una fórmula comuna; es tracta dels : ‘Facta carta in mense … anno … regnante Karulo rege‘, que considerada amb l’anterior ens posa de manifest com el record de Lluís el Tartamut en les clàusules de datació, es concentrà, en els inicis del segle X, en la documentació gòtica i no en l’aquitana o la borgonyona.

A la mateixa alçada, però a la dreta de l’amàs gòtic, trobem una altra agrupació, més petita i esfilagarsada, símptomes d’una major variació interna; es tracta de les signatures dels escrivans preveres en format: ‘X presbiter rogitus scripsit .. die … anni que supra‘.

Sota d’aquesta i ja en la part exterior de l’amàs gòtic, hi ha una concentració poc densa, que en el seu centre, ens recull una versió força especial d’una altra de les seccions habituals en els contractes de transferència de propietats, es tracta de les clàusules de salvaguarda, en aquest cas, les de format: ‘Etsi quis contra hunc decretum nostrum ausus fuerit usurpare decimas vet primitias omnia quod … in quadruplum & insuper anathematis vinculo sciat se abligatum‘, i variants, que semblen ser bàsicament urgellenques i que mostren l’interès per establir legalment la propietat dels delmes de les parròquies de nova creació.

Just a la seva esquerra, i una mica més ben definit, tenim, encara en els documents gòtics, les signatures dels promotors de la transacció; en concret, les de format: ‘Signum X , qui hanc carta rogavi scribere & testes firmare ut sua signa facerent‘, i variants properes.

I a la seva esquerra, un petit grup, però fortament connectat (és a dir, de fragments pràcticament idèntics) i també sols en documents gòtics, que ens complementa la primera agrupació de fragments de text que hem comentat, ja que es tracta de l’altra fórmula introductòria més habitual: ‘In Dei nomine.

Si passem al grup borgonyó situat en el quadrant sud-est, tenim una agrupació central fortament connectada que correspon a la sentència: ‘Actum X villa‘. En l’extrem sud-est, tenim una sèrie de parelles de fragments aïllats molt semblants entre sí, i que es deuen a dues butlles papals, pràcticament idèntiques, una aparentment de l’any 878, i l’altra de l’any 896.

En la part occidental del grup borgonyó, tenim dues agrupacions molt properes, que reflecteixen però formulacions diferents; una captura les signatures dels escrivans de forma: ‘X rogatus escripsit , subscripsit , superdadavit die … , in mense … , in anno … rengnante Karlo rege‘, mentre que l’altra, recull les clàusules de salvaguarda semblants a: ‘Si quis vero , si ego nos ipsi , aut ullus omo , aut ullus de eredibus nostris tentare vel calumniare presumpserit , auri … conponet , & ec donacio ista in te facta firma & stabilis permaneat , cum stibulacione supnixa‘.

Si ara passem al grup aquità, ens trobem que curiosament no presenta a penes acumulacions clares. Ja hem esmentat abans les datacions per el rei Carles compartides amb la documentació gòtica; en la part inferior hi ha un petit grup de 6 còpies d’una mateixa expressió que no és altre que: ‘Benedictus scripsit‘, fórmula doncs estrictament personal d’un escrivà de Roergue. A la seva dreta, tenim un trio de repeticions fidels d’una mateixa fórmula introductòria: ‘Locum sacrum sancte Dei ecclesie qui est situs in pago Ruthenico , super alveum Dordonis , & est fundatus in honore domini nostri Jhesu Christi pseu Sancte Marie virginis & sancti Petri principis apostolorum necnon & clavigeri , ubi sanctis Vincencius & sancta Fides tumulati esse videntur‘, però mes enllà d’aquestes repeticions molt fidels, les agrupacions de fragments molt semblants, que és el que aquest graf mira de capturar, semblen poc definides en la documentació aquitana. Just sobre el grup de ‘Benedictus‘, per exemple, tenim un grup força gran però poc definit que ens captura diferents fórmules (cal pensar que l’efecte dels lligams del nodes de documents amb els seus fragments ens està emmascarant les agrupacions d’aquests), així, per exemple, trobem nodes amb clàusules de signatura tipus: ‘X qui carta donatione ista scribere vel adfirmare rogaverunt‘ i ben aprop seu en canvi clàusules de salvaguarda en formats semblants a : ‘Sane , quod minime credimus , si nos ipsi , immutata voluntate nostra , aut ullus de heredibus nostris , vel ulla immissa persona , quae contra cessionem istam ire aut inquietare praesumpserit , inprimis iram Dei omnipotentis incurrat & S. Petri , deinde componat cui litem intulerit , sociante fisco auri libras quince , argenti pondera duodecim coactus exsolvat , & quod petit non vindicet ; sed praesens cessio ista firma & stabilis permaneat cum stipulatione subnixa‘ particulars del context llemosí.

Finalment, no podem deixar de comentar ni que sigui superficialment la darrera gran agrupació del graf, en el seu extrem sud-oest, que no és altra que la dels preceptes reials, tant els provençals com els francs. En el seu extrem inferior, tenim que l’agrupació més clara i intensa, reflecteix una frase que es repeteix idèntica en tots els contexts geogràfics: ‘Signum Karoli (Monogramma) gloriosissimi regis‘; prou explícit, oi? Examinat el conjunt, sí que s’observa una separació entre els preceptes provençals i els gòtics o francs. En el primer, lògicament, les signatures de Lluís: ‘Signum Ludovici serenissimi regis‘, o ‘Signum domni Hludovici (monogramma) serenissimi imperatoris augusti‘ i referències geogràfiques repetides com:’in pago vero Brionensi , Pismacum villam cum omni integritate‘, i altres. També la banda franca té els seus trets protocol·laris propis; per exemple, el reconeixement notarial: ‘Heriveus notarius ad vicem Folchonis archiepiscopi recognovit‘ i similars, o les localitzacions en el tancament: ‘Actum apud X. In Dei nomine feliciter. Amen‘. El que sí comparteixen, i així es pot veure clarament en la part lateral esquerra de l’agrupació ‘reial’, és la fórmula introductòria: ‘In nomine sanctae & individuae Trinitatis. X , gratia Dei rex‘ i variants.

Veiem ara què passa si obrim el marge de semblança fins el 0.5:

fragw728-5-th

3.317 fragments amb 49.899 enllaços amb un grau de semblança >= 0.5
Aquest graf pot no ser adequat per a ordenadors de gama mitja!

Aquí tenim un graf força diferent de l’anterior; en aquest, al obrir el marge de semblança, el nombre de connexions de cada fragment s’ha incrementat molt, amb el resultat global, que a diferència del graf anterior, en el que els nodes ‘document’ (els de mida grossa) mantenien els seus fragments a prop, aquí els fragments han ‘escapat’ completament dels seus documents, que s’han vist relegats a una posició central, equidistant dels diferents grups que les semblances entre fragments defineixen, força més clarament que abans. El graf és molt gros, i no és el cas de comentar tot el que se’n pot derivar, ni molt menys, sí però que cal fer-hi alguns comentaris evidents.

Començarem per l’amàs tricolor de la dreta; què són aquests grups tan grans i tan ordenadament disposats? Doncs no són altra cosa que les clàusules de datació segons l’any de regnat del regent. La disposició mostra com, si bé cada grup és internament homogeni, tampoc és faltat de paral·lelismes amb les tradicions contigües entre la Gòtia, Aquitània i Borgonya i ens il·lustra quins documents específics presenten anomalies (colors fora de lloc). En aquest sentit, per exemple, la venta que Adalardus i Deodata feren l’any 908, tot i ser d’evident context borgonyó, presenta una datació completament en línia amb les aquitanes, o la donació que el prevere Marteses feú al bisbe de Nimes, Ucbertus, que en presenta una de ben gòtica. Altres fórmules més variades es poden trobar en l’interior de l’arc que dibuixen aquests tres grups i amb la conseqüent i ampliada dispersió geogràfica.

Ignorem de moment el centre on la superposició dels nodes de documents dificulta molt la lectura i fixem-nos en la part inferior central del graf. Tenim un grup aïllat en la part baixa de procedència geogràfica variada que correspon a la frase introductòria del diplomes reials que ja s’havia detectat en el graf previ, en aquest, continua estan poc connectada amb la resta de fragments. Just a sobre d’aquest grup s’aprecien tres grups ben localitzats geogràficament, un de gòtic, separat, i un d’aquità i un de borgonyó que es comuniquen entre ells. El gòtic ens il·lustra un element molt freqüent en la documentació però que encara no havia fet acte de presència, les afrontacions; per exemple: ‘… que affrontat : de parte orientis in terra de … , & de meridie in terra de … , & de ocidentis in … , & de circi in …‘. En canvi, les agrupacions aquitana i borgonyona, corresponen a les signatures dels promotors dels contractes, que ja hem vist abans.

Desplaçant-nos a l’extrem esquerra, tenim un gran amàs gairebé totalment gòtic, que correspon a les signatures dels escrivans; en aquest grup, tant sols se li apropen / assemblen unes poques signatures provençals. Resulta notable l’acumulació i l’aïllament d’aquesta part tan típica dels formularis en (gairebé) una única tradició.

Si ara anem al quadrant nord-oest, en la part baixa, tenim unes agrupacions també exclusivament gòtiques. La més externa i clarament definida, correspon a les signatures dels testimonis en format: ‘Signum X Signum Y Signum Z‘.; el nombre de signants varia, però en la part central és de 3. Just a la dreta d’aquesta agrupació n’hi ha una altra menys ben definida que correspon a les signatures dels promotors en format: ‘Sig+num X Sig+num Y , …qui  hanc vendicionem fecimus & testes firmare rogavimus‘: , la dispersió del grups indica les variacions existents (exacerbades, recordem,  per el fet que en aquest còmput s’han comparat també els noms dels participants). A la seva mateixa alçada en el graf, però ja tocant la part central, tenim una altra agrupació eminentment gòtica corresponent a una altra de les seccions habituals en contractes de compra-venda, es tracta de la de consignació de l’intercanvi realitzat i per tant, del seu preu: ‘Vindimus nos … , cum … , quantum infra istas quatuor afrontaciones includunt ab omni integritate , cum exio vel regresio suo , in adorato & definito precio … tantum , quod vos entores dedistis , & nos vinditores de presente manibus nostris recepimus , & nihilque de ipso precio aput vos emtores non remansit , & est manifestum‘ , i altres formes variants.

I així arribem a la part central superior del graf, on trobem coses que ja havíem trobat abans. L’agrupació borgonyona més amunt i aïllada, es tracta dels: ‘Actum X villa‘ i variants. En el grup a la seva dreta i ja més baix, hi retrobem les signatures reials i al seu costat, els: ‘Actum X in Dei nomine feliciter amen‘. Més abaix i a la dreta de l’amàs gòtic dels: ‘In nomine Domini‘, i a la seva alçada però a l’esquerra, trobem una altra de les fórmules habituals en les transmissions de bens; la clàusula de cessió de drets,  els: ‘Quem vero ipsos … de nostro iure in vestro tradimus dominio & potestatem abendi , … quidquid exinde agere , … volueritis , liberam in Dei nonime abeatis potestatem ex presenti die & tempore‘. I finalment, ja tocant el grup central i a prop de l’amàs dels ‘In nomine Domini‘, tenim un grup més dispers que sumat a aquest ens tipifica també la clàusula inicial més usual de les transmissions de bens de la Gòtia: ‘In nomine Domini. Ego X & Y vinditores tibi Z , emtore‘, que si la segmentació dels texts hagués estat feta sempre sota un mateix criteri apareixeria certament més ben definida.

Hi han encara moltes més repeticions de sentències que es troben en la part central del graf, però la presència dels nodes de documents en dificulta massa la lectura,  haurem de provar una aproximació diferent a les dades per poder-ne gaudir. Mentrestant, fem una ullada a què passa si ampliem encara més el grau de semblança fins el 0.4:

fragw728-4-th

4.150 fragments amb 92.056 enllaços amb un grau de semblança >= 0.4.
Aquest graf pot resultar excessiu per a ordenadors de capacitat mitjana!.

Graf que en una simple ullada, revela la seva semblança amb el graf anterior, tot i que gairebé es doblen el nombre de connexions, i que per tant ens indica que el model de les relacions de semblança, en aquest mètode de selecció de dades per damunt d’un cert valor de tall, ja no evoluciona gaire. Amb tot, la presència dels nodes de documents sí sembla estar jugant un rol distorsionant, o si es vol, emmascarant, provem doncs a eliminar-els completament i refer el graf per tal de veure com els fragments s’agrupen lliurement, tan sols depenent del seu grau de semblança. Aprofitem per elevar el grau de semblança a 0.5 per mirar de millorar la visualització dels grups, i ajustar la mida dels nodes segons el grau d’Excentricitat:

fragwnd728-5lb-th

4.150 fragments amb 83.473 enllaços amb un grau de semblança >= 0.5.
Aquest graf en format SVG pot resultar excessiu per a ordenadors de capacitat mitjana!.
Cliqueu en la imatge per un gràfic amb les fórmules de cada agrupació.

A diferència dels altres grafs, en aquest, el fitxer SVG corresponent l’hem enllacat en el peu de la imatge, per tal d’aprofitar les imatges no interactives per sobreposar a cada grup el fragment de text que li és característic i en un sol cop d’ull poder veure les diferents sentències que més clarament es van repetint en els documents. Altra cosa és l’amàs central, on es concentra una part no pas menor dels fragments que tot i tenir semblances significatives entre ells, no es poden agrupar en nuclis diferenciats (si més no, amb el procediment que estem emprant aquí, que recordem que diferencia tant entre els antropònims com entre els topònims).

Tenim doncs, que es poden diferenciar al voltant d’una vintena de seccions textuals que es repeteixen (24 en el graf, però depenent del criteri emprat se’n poden definir de més o de menys) i que sens dubte formen els maons dels formularis que a finals del segle IX, inicis del X s’utilitzaren en la Gòtia i territoris adjacents. Sembla clar que si bé la segmentació de texts emprada en aquest còmput no era especialment rigorosa, si més no, sí era lo prou estable com permetre aquestes deteccions que hem estat detallant.

Són uns primers resultats, però semblen certament encoratjadors si tenim en compte la simplicitat i flexibilitat del sistema emprat. Més enllà d’això, hi ha tot un camp i múltiples derivacions. Les distribucions geogràfiques de les semblances, i en especial, les seves conjuncions, ens parlen de tradicions compartides, i per tant, de contactes culturals i al cap i a la fi, d’història. També en la vessant més estrictament relacionada amb la Diplomàtica, no sembla impensable, per exemple, poder-se apropar a la definició automàtica dels formularis subjacents en la documentació si fem abstracció dels elements onomàstics i tenim en compte el factor geogràfic; però això, encara és especulació…


Notes

Aquesta entrada s'ha publicat en Adalardus i Deodata, Beaulieu, Benedictus, Brioude, Carles el Simple, cathalaunia.org, Cluny, Conques, detecció de formularis, distància documental, estadística, Fons Cathalaunia, formularis, Fulquerius i Raimodis, Gòtia, Gephi, Gescafredi, Guifré Pilós, Guifré-Borrell, Lluís el Cec, Lluís el Tartamut, Luitprand, Marteses, Nimes, Otger Cataló, Sant Vicenç, segmentació textual, semblança documental, Serfdedéu, Sunyer, Ucbertus i etiquetada amb , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

2 respostes a Semblances documentals (2).

  1. Joan Negre ha dit:

    Un gran treball, Joan. Un estudi interessantíssim amb una burrada d’hores al darrere, no sempre reconegudes. Està bé veure que no estem sols al tractar de fer de la Història una Ciència (amb majúscula, a pesar que a molts els agradaria afegir-li el prefix pseudo al davant), metodològicament rigorosa i amb resultats contrastables. Moltes felicitats per la feinada!

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out / Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out / Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out / Canvia )

Google+ photo

Esteu comentant fent servir el compte Google+. Log Out / Canvia )

Connecting to %s