Bascoiberisme circular?

Tot just fa uns dies, en l’apunt anterior, es destacava que havent mesurat en un recent article les distribucions d’una reducció a 12 sons bàsics en una comparativa entre l’ibèric nord-oriental i altres llengües relacionades (tres d’actuals: eusquera, català i castellà i una antiga: el llatí), l’altíssima correlació entre l’eusquera i l’ibèric nord-oriental descartava una semblança ocasional o arbitrària.[1].  És el cas ara de tornar-hi, ja que tot fa pensar que certament la raó no és pas arbitrària, però que tampoc és la desitjada, tota vegada que lluny de poder emprar l’eusquera actual per apropar-se al ibèric nord-oriental, com s’albirava en la part final de l’apunt anterior, estem probablement davant d’un artifici induït per un error metodològic en el procés de desxiframent de l’ibèric nord-oriental. Expliquem el raonament que duu a aquesta conclusió.

L’experiment consistia en reduir les llengües a comparar a dotze sons bàsics: cinc vocals (A, E, I, O, U) i set sons consonàntics ( lateral, fricatiu, velar, nasal, dental, labial, sibilant = L, R, K, N, T, B, S). És a dir, agafar el corpus de l’ibèric nord-oriental per una banda, i un text existent en les altres llengües per l’altra (els primers 5 capítols del Gènesi) i reduir-los tots a aquestes 12 sonoritats, per el simple mètode d’agrupar convenientment els caràcters que formen l’abecedari d’aquests idiomes i recomptar-los. El que fa que pugui funcionar un procediment tan simple, és doble. Per una banda, tenim el fet que tots aquests idiomes comparteixen en gran mesura una mateixa translació lletra-so, i que per tant, un simple recompte ens acosta força a l’objectiu[2], i per l’altra, que en mesurar sols els percentatges de cada lletra/so en cada idioma, ni la diferència de contingut (Gènesi vs. texts ibèrics), ni la mida de cada corpus té un efecte especialment esbiaixant[3].

En un primer moment, l’objectiu era comparar l’ibèric amb aquestes parles, per veure quin grau de proximitat hi havia a un nivell tan bàsic com el de les freqüències relatives dels seus sons principals. Els resultats, van ser claríssims. En un estimador com el grau de correlació de Pearson (on 1 indica correlació total, 0 no correlació i -1 correlació inversa), la comparació entre l’ibèric i l’eusquera actual s’enfilava fins quasi el 0.9, mentre que amb la resta d’idiomes, baixava al 0.6 o menys.

geu-3

Grau de correlació entre l’ibèric nord-oriental i l’eusquera, el català, el castellà i el llatí.

Ara, el dubte que naixia era com valorar aquests resultats, ja que lògicament, la valoració d’un coeficient matemàtic depèn del domini que s’estigui mesurant. Si estem parlant d’objectes geomètrics o matemàtics, una correlació de 0.9 pot ser un grau baix si s’esperava identitat, per contra, en temes socials, un 0.8 usualment ja es pot considerar un valor alt, tota vegada que a priori el que s’està comparant té menys probabilitats de respondre a una relació geomètrica (que es el que de fet mesura el coeficient). En altres termes, era 0.9 un grau de correlació propi de… dialectes?  De llengües germanes? De…?

La dificultat semblava estar en trobar estudis filològics quantitatius que haguessin fet una mesura lo prou semblant com per establir algun criteri comparatiu fiable. Però la resposta estava més a prop del que s’esperava. Havent fet la comparativa d’aquestes quatre llengües amb l’ibèric nord-oriental, fer la mateixa comparativa entre totes ells, era gairebé trivial (la feina feixuga ja estava feta). De manera, que es completà la comparança, amb les parelles que no havien estat considerades en l’experiment inicial. Cinc llengües ens donen deu possibles parelles, les quatre de la gràfica anterior i sis més. Gràficament:

pearson10

Correlació de Pearson de les freqüències relatives entre l’ibèric nord-oriental, el català, l’eusquera, el castellà i el llatí reduïts a 12 sons bàsics.

Aquesta simple gràfica, d’aspecte aparentment anodí ha acabat obrint la caixa dels trons (metafòricament parlant).

Fixem-nos d’entrada tan sols en els dos valors més alts: la correlació entre ibèric-eusquera (~0.9) i entre català-castellà (~0.8). Que la correlació entre dues llengües contemporànies, veïnes i romàniques, o sigui, emparentades, sigui clarament inferior a la que hi ha entre una llengua desapareguda fa 2.000 anys i una d’actual com l’eusquera resulta pràcticament inexplicable. És que 2.000 anys han passat sense modificació per l’eusquera? Era llavors encara més semblant a l’ibèric (i en aquest cas estaríem pràcticament parlant de identitat) i sols s’han separat aquest 0.1? Sembla una casualitat astronòmica que comparant dues parles separades per dos mil·lennis (i una d’elles desapareguda des de llavors) la correlació sigui significativament  més alta que la que hi ha entre parles més properes, contemporànies, veïnes i emparentades com el català i el castellà. No té sentit.

Posem un exemple concret per mirar de visualitzar millor aquests coeficients aplicats al domini que estem tractant. Fem un experiment imaginari, suposem que el castellà fos la llengua desconeguda (escrita en glifs allunyats de les nostres lletres i sense espais entre paraules) i que en un procés de desxiframent n’hem arribat a confeccionar el seu mapa sonor (i que a més, és tal i com tots realment ho coneixem). Agafem un text curt com el del primer dia de la creació del Gènesi, i el reduïm als 12 sons bàsics de la metodologia de comparació; tindríem això:

ENELCONIENSOTETOTOTIOSKREOELKIELOILATIERRA:
LATIERRANOTENIAENTONKESBORNAALKUNATOTOERAUNNARBROBUNTOKUBIERTOTEOSKURITATIELESBIRITUTETIOSSENOBIASOBRELASAKUAS:
TIOSTIIOAIALUSIUBOLUS:
ALBERTIOSKUELALUSERABUENALASEBAROTELAOSKURITATILALLANOTIAIALAOSKURITATLALLANONOKE:
TEESTENOTOSEKONBLETOELBRINERTIA:[4]

És a dir, hauríem arribat a la conclusió que aquells signes sonaven més o menys així (recordem que representa que el castellà ens és desconegut). Algú es creu que s’hauria tardat gaire a llegir el seu contingut des del català (evidentment, ignorant que és un text de vell antuvi ben conegut per a nosaltres)? No són les semblances notòries? Doncs això es dóna entre llengües amb un coeficient de correlació de 0.8[5], quan més properes haurien de ser si fos de 0.9? Ja que això és el que es mesura entre l’ibèric nord-oriental i l’eusquera actual. És aquí que cercant l’explicació més simple,  neix una sospita ‘horribilis’.

I si aquesta proximitat excessiva és deguda a un esbiaix metodològic en el procés de desxiframent que ha primat innecessàriament els paral·lelismes amb l’eusquera?

Dit d’altra manera, la màquina, el recompte, ens dóna eusquera com a més proper a l’ibèric, per el simple fet que li hem ficat eusquera abans, en el procés de desxiframent. D’aquí el circular del títol de l’apunt, ja que estaríem davant del mateix fenomen del raonament circular on l’efecte es torna causa.  I anant al detall del cas, cal entendre que el procés de reducció a 12 sons bàsics elimina (ja que unifica) les disquisicions més modernes sobre l’escriptura ibèrica, com la diferenciació entre sil·làbics forts o fluixos, la duplicació de les vocals o el só d’alguna nasal. La semblança hauria de provenir de l’esquema bàsic, forjat – si no vaig errat – en la primera mitat del segle passat. El mapa que en Gòmez-Moreno el 1922 atribueix al sistema Delgado-Hübner (reeditat el 1949) , ja recull l’estructura bàsica que comporta aquest grau de correlació excessiu.

Però anem més enllà i tornem a la gràfica de la comparativa global. Si ens hi fixem, les correlacions entre les tres llengües modernes (el català, els castellà i l’eusquera) formen el gruix de la part alta de la gràfica, ja que ocupen el segon, tercer i quart lloc, mentre que les correlacions que inclouen parles antigues, el llatí o ibèric, formen les sis posicions inferiors de la gràfica. És a dir, tant el llatí com l’ibèric, difereixen més respecte les parles modernes (i entre sí), que no pas les modernes entre sí, fet que resulta lògic si pensem que el pas del temps hauria de tendir a evolucionar, i per tant, separar dels seus origen a les parles. Excepte però, en el cas de l’ibèric vs. l’eusquera actual, que no sols no està en la part baixa (com es podria esperar), sinó que és el màxim destacat de totes les correlacions possibles. Una anomalia en tota regla.

Podem mirar de plasmar-ho en un dibuix, prenent el complement de les correlacions (el que falta fins 1) com una ‘distància’ entre les llengües (al no formar una mètrica no es poden satisfer totes les longituds, de manera que no és més que una aproximació, caldrien quatre dimensions com a mínim per disposar-ho com cal).

langdist

Distància (1-correlació) entre llengües.

On veiem que el llatí està convenientment separat de les llengües modernes (en groc), però que l’ibèric, tot i estar a una distancia semblant a la del llatí respecte al català i el castellà, està però anòmalament  a prop de l’eusquera. Si pensem que la filiació ha de tendir a apropar i que la distància temporal tendeix a allunyar, podríem explicar perfectament la relació del llatí amb les altres llengües, però en el cas de l’ibèric falla en la proximitat amb l’eusquera, que faria creure més aviat que són contemporànies. I sent l’ibèric la única llengua de les cinc mesurades de la qual no coneixem de primera mà la seva sonoritat original,  no sembla difícil pensar, com dèiem, que l’anomalia neix degut a què la proposta actual ha estat modelada a partir de l’eusquera modern; el raonament circular que dèiem. Caldria confirmar si el bascoiberisme no sols ha procurat traduir l’ibèric, sinó que abans, n’ha estructurat preferencialment el seu desxiframent.

Vol dir això que el desxiframent actual està tot malament i que els nombrosos punts de contacte amb el basc són tots miratges? Doncs probablement no, però el problema més urgent, seria potser mirar d’entendre on es va torçar innecessàriament vers l’eusquera. Va ser en la definició del mapa sonor ibèric (inevitablement perdut en el temps, tret de pervivències en llengües actuals com el català o el propi eusquera)  i/o en la projecció d’aquest mapa sobre la seva variada representació sígnica?

Lamentant-ho molt, s’ha de deixar la qüestió oberta, aquí. No sabria pas dir si és que hi havien més  sons en origen (o diferents), o si es tracta sols de què la seva assignació als signes és defectuosa. El que sí potser podria ajudar a explicar aquesta anomalia estadística, és la raó del fracàs dels intents de comprensió de la llengua ibèrica a partir de la basca.

Si hi han noves s’aniran afegint al fons en forma d’actualitzacions…

 

– Actualització 2016-XI-23 –

Una breu recerca en la història contemporània ha permès respondre fàcilment les preguntes que es feien al final de l’apunt (per algú acostumat a l’alta edat mitjana, quin luxe això de poder disposar de documentació abundant…!). En Gòmez-Moreno explicà en primera persona el procés de desxiframent de l’ibèric (per exemple a: Gómez-Moreno, Manuel : 1943 : “La escritura ibérica y su lenguaje” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.257-281) i la bibliografia és força abundant[6]. Els resultats, com acostuma a passar en l’estudi de la Història, superen les expectatives, de llarg.

Per dir-ho de forma abreujada: no fou el bascoiberisme el que dirigí el procés de desxiframent de l’ibèric, fou el nacionalisme espanyol.

De entrada, ja va semblar estrany que un personatge amb un perfil sociològic com el del granadí Gómez-Moreno hagués propiciat una lectura bascocèntrica[7], però el fet, és que tal era el discurs del nacionalisme espanyol del moment (i en bona part, encara ara ho és) que reconeixia l’element basc com a propi i representatiu de les seves essències primigènies. Ho diu amb totes les lletres en el seu discurs del 1942 d’accés a la R.A.E:

“Si oimos hablar a un francés, lo diputamos extraño a nosotros por su acento, y si le medimos el cráneo se confirma el hecho.
Pero si oimos la lengua vascuence nos suena tan a nuestro que la acogemos gustosos. Y, de hecho, ahí está el hombre vasco, el ibero, pesando sobre nuestra historia, con su mentalidad no conformista permanente, su inquietud; hoy, guerrillero, ayer, en aventuras de mar, antes, soldado a merced de Roma, por Italia y Sicilia, sin apegos fuera de lo suyo; y ahí le tenéis conservando su hombria de bien, tanto como su encortezada fiereza.”

I és que si mirem el que deia vint anys abans, quan plantejà la seva teoria, la proximitat que hi veia amb el basc era ben palesa (Gómez-Moreno, Manuel : 1922 : “De epigrafia ibérica. El plomo de Alcoy” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.219-231):

“El desvio singular a poner consonantes oclusivas ante continuas, la alternación frecuentísima de unas y otras, escasez de sordas y falta de aspiradas, que pone de manifiesto el plomo alcoyano, prestaria cierta suavidad y ritmo a su lenguaje, cual hoy mismo lo conserva el vascuence; y es muy notable que iguales caracteres parecen regla en la onomástica nuestra primitiva, como si ello constituyese algo típico del iberismo.”

Tot i que ja remarcava llavors que la distància temporal feia inviable els intents de traducció:

“El aspecto externo parece convidar a una asimilación; sin embargo, ni es posible definir que el vasco actual sea como el de ha veinticuatro siglos, ni que dejase de haber variación, y quizá grande, entre el habla de los Pirineos y la de Alicante, aun suponiendo un origen comun para ambas.”

Sembla increïble que un segle més tard, encara s’estigui, bàsicament, al mateix lloc! Però arribats aquí, cal preguntar-se com s’ho feu en Gòmez-Moreno per desxifrar l’ibèric amb el motllo basc sense adonar-se’n? I la resposta que apareix és terrible, per tautològica. Ho feu a base d’ignorar sistemàticament l’element català, i per extensió, arribar a ignorar fins i tot la Ibèria de les fonts preromanes, que la identifiquen clarament com la cantonada nord-occidental del mediterrani, i emprar exclusivament una mirada històrica esbiaixada per el nacionalisme espanyol.

En aquesta mirada, com ja varem comentar en l’apunt anterior, Ibèria tenia el seu començament en la Turdetània (o Tartessos) i era un fenomen autòcton de la península; com a molt, posats a buscar un origen, seria africà (les semblances amb el berber, la teoria de Schulten, etc). I les escriptures ibèriques, havien de derivar totes de la tartèssia per el simple fet de ser aquesta la més antiga. Si calia cercar un substrat, quelcom ‘primitiu’, havia de ser el basc, el català ni s’esmenta, i és que no era políticament correcte. Es pot constatar, de nou, en el seu discurs de l’any 1942, on repassa lloant totes les ‘llengües hispàniques’ però la paraula ‘català’ ni hi surt; sols en parla en el penúltim paràgraf:

“Otras fuerzas periféricas penínsulares, aunque pesen muy mucho, actuaron menos a gusto, en virtud de su orientación hacia el exterior y su autocentralismo peculiar; fieles a nuestra tesis, con oir el habla de Barcelona, Valencia y Lisboa nos damos cuenta de que factores extraños les prestaron su acento.”

Prou clar, no? Països Catalans i Portugal no són ‘hispànics’. Són estrangers, han estat alienats en algun moment indeterminat…! Tot i que la principal peça evidencial que emprà per fer el desxiframent fou el plom de la Serreta precisament d’Alcoi (un text ibèric del segle VIaC escrit en grecoibèric, és a dir, una mena de pedra de Roseta per el que fa al desxiframent), el català no podia ser cap mena de referent! En tota la seva obra que hem pogut llegir falta l’element català, l’iberisme mediterrani és com si no existís i no proporcionés el gruix de les evidències epigràfiques. Els ibers de les nostre terres, els de la costa entre el Xúcar i el Roina, no existeixen, no tenen perfil lingüístic propi, la seva escriptura és una extensió tardana (s. III aC) de la tartèssia (de fet, la descriu com la seva fase pòstuma), i s’oblida premeditadament el rol preferent que consta en els clàssics. Com a molt, imagina uns pobles primitius entre l’Ebre i els Pirineus on hi hauria un aglomerat de pobles que parlarien el basc de fa 2.400 anys[8].

Hom pensaria que tals desviacions haurien estat corregides fa temps, però no, la tesi d’en Gòmez-Moreno encara és la oficial, i la unitat de les escriptures ibèriques es proclama per exemple en les propostes de codificació per a Unicode de la UB de l’any passat, i aquesta mateixa desproporció evident en obres del segle passat es pot trobar encara en obres modernes de referència que apliquen la mateixa mirada pan-hispànica unificant, i on el sud de la península rep usualment el gruix de l’atenció. De fet, fins ara, no he tingut la sort de trobar cap treball que proposi l’ibèric com substrat del català/occità. Ho he sentit expressar públicament per experts de món de l’arqueologia ibèrica, però no he llegit cap proposta concreta, el que sí he vist és dubtar de la filiació exclusiva del català amb el llatí.

Entrant més en detall, ens preguntàvem també si l’error sistèmic d’en Gómez-Moreno estaria en la definició del mapa sonor, o sols en l’assignació dels glifs. També això té resposta.

Aplicant la tautològica filiació iberico-turdetana i l’exclusió de l’element català, el mapa sonor del que partí el granadí, es basà en la part congruent entre la sonoritat del castellà i del basc[7b] . D’aquí, per exemple, les cinc vocals, o la necessitat d’absència de p en l’ibèric, i la tant esmentada absència de muta cum líquida (oclusiva seguida de l o r) i d’agrupacions consonàntiques. Per tant, el mapa sonor que emprà, mancava d’elements freqüents en la nostra parla[9], i el conduí a proposar el sistema semisil·làbic per les oclusives, que forma l’estructura més idiosincràtica de la seva proposta (les vocals i altres consonants, s’havien derivat majoritàriament de monedes i toponímia comparada). En Gòmez-Moreno era ben conscient de les semblances amb el basc del seu sistema: de “La’escritura ibérica y su lenguaje” p.270.

“La ausència de letras muda y líquida seguidas es muy esencial en lo ibérico, de acuerdo con las lenguas semíticas y también con los dialectos vascos, lo que decidió probablemente la organización de su escritura, y ello a partir del silabismo, punto en que hemos de basarnos necesariamente.”

Resulta curiós que explicant-ho en primera persona, reconeix que trobant-se en la transcripció del plom d’Alcoi amb elements no coincidents amb la seva disposició, com paraules acabades amb oclusives sordes (que els trobem per exemple en el català i juntament amb grups consonàntics, en moltes llengües indoeuropees), els descartà de vell antuvi (del paràgraf abans de la cita anterior):

“En Alcoy aparecen anomalías en fin de palabra, con sílabas cuya última consonante es oclusiva (gik, ok, lirg, bind, bask), coincidiendo con empezar por b la palabra siguiente, salvo una vez que es una s.”

És a dir, tot i que el seu propi sistema no funciona del tot en la pièce de résistance sobre la qual construirà el semisil·labisme ibèric (en un text de 46 paraules, tenim fins a 8 casos: baśk, bagaŕok, leguśegik, tebind, tagisgaŕok, gaibigait, śalirg, boiśtingiśdid, és a dir, una de cada cinc o sis), aquestes incongruències no tenen més consideració que ser ‘anomalies’, sense cap altre efecte.

Tenim doncs per una banda un mapa sonor restringit, aplicat per igual a tot el territori peninsular i a la totalitat de testimonis epigràfics i amb una projecció sobre el signari basada en un semisil·labisme no plenament concordant amb l’evidència, però que recorda al basc (naturalment, del segle XX) com reconeix el propi autor. I per l’altra, tenim un signari que sense haver estat prèviament sistematitzat, es agrupat en conjunts que acorden amb la teoria fonètica prèvia i amb glifs identificats entre les escriptures del mediterrani oriental (en això, en Gòmez-Moreno sostenia una filiació del tartessi més plural que la estrictament semita). El propi autor en dóna la seva disposició a: “La’escritura ibérica y su lenguaje” p.274:

gmm

Les agrupacions de glifs d’en Gómez-Moreno. 89 glifs en 28 categories.

Fins a 28 categories fonètiques amb un total de 89 glifs, que és una distribució pràcticament idèntica a la proposta actual (si considerem que no està desdoblant els sil·làbics) i que provoca la proximitat estadística amb el basc actual. Resulta interessant que el nombre total de glifs que recull cau dins la forquilla de 85-96 de l’estimació quantitativa feta a partir de les co-aparicions (tot i que no són els mateixos glifs).

O sigui, que si recapitulem, en Gómez-Moreno no modelà probablement l’ibèric sobre el basc a posta, sembla que fou més aviat un resultat induït per el reduït mapa sonor que contemplà acríticamen, sumat a la simplificació que feu de la sonoritat del plom d’Alcoy a quelcom que reconeixia com proper al basc al que considerava element ‘primitiu’ o primigeni. En l’assignació dels signes, seguí un procés de selecció eclèctic, les vocals, les consonants continues, i algunes síl·labes amb oclusiva ja havien estat apuntades prèviament, i en arribar a idear el model semisil·làbic sistematitzà els signes que faltaven amb referents d’escriptures del mediterrani oriental. El resultat és la proximitat estructural que propicia l’anòmala (per alta) correlació estadística entre els sons de l’eusquera actual i els de la seva proposta de desxiframent de l’ibèric.

De manera que no, el bascoiberisme no provocà les semblances estructurals del desxiframent de l’ibèric amb l’eusquera actual com podia semblar a primer cop d’ull en constatar que la proposta de desxiframent actual de l’ibèric fa que sigui més semblant al basc del segle XX que no pas ho són entre sí el català i el castellà contemporanis. Ho feu la visió ahistòrica filla del nacionalisme espanyol que preferí ignorar l’element epicòric del gruix de l’escriptura ibèrica i en reduí el seu mapa sonor a lo més simple a partir de la intersecció del basc i el castellà (5 vocals, no muta cum liquida, no p,etc), tot i que l’evidència filològica no era plenament coincident i que l’esbiaix històric era més que evident. El context sociopolític del moment permet explicar-ho, el que no sembla de rebut és que no hagi estat convenientment corregit.

Tenim doncs probablement un sistema parcialment correcte, però al que hi falten possiblement sons i on la interpretació fonètica dels signes sembla clar que tampoc és completa (per començar, si més no, no lo prou com per donar raó del plom d’Alcoi). L’aportació moderna quantitativament més important (inclosa en el resum que presenta la proposta Unicode[10]) potser sigui el desdoblament de les vocals en l’ibèric nord-oriental, que va clarament en la línia que diem d’ampliació del mapa sonor original, tot i que la seva anàlisi és encara parcial i pobrement evidenciada[11]. Sumem-li els finals amb oclusiva del plom d’Alcoi i tal vegada estiguem davant d’un sistema de representació més flexible i aproximatiu, on potser alguns sil·làbics també poguessin representar el so consonàntic pur, més que no pas la rigidesa de la interpretació sil·làbica actual? No cal multiplicar les especulacions aquí…

Que la parla de fa 2.000 anys del mediterrani occidental tingués una semblança amb el basc d’avui en dia és una possibilitat, però que fos encara més gran que la que hi ha entre els actuals català i castellà, no. Com també sembla lògic que si en algun lloc la parla dels ibers de les fonts grecoromanes hagés pogut deixar una empremta és en les seves pròpies terres i en les parles dels seus habitants, és a dir, simplificant, les nostres, les que actualment aproximadament coneixem com els Països Catalans, la Septimània i Tolosa i en el substrat de la seva llengua pròpia: el català/occità. Terres i cultures que han evolucionant de forma conjunta al llarg del segles per damunt, o si es vol, a través de, les seculars vicissituds polítiques i que parlant de llengua, després de més de mil anys de romanització produiran la parla catalano/occitana. Consideració epicòrica, però, que ha estat furtada en el desxiframent de l’ibèric.

 

– Actualització 2016-XII-6 –

S’havia plantejat fins a quin punt podria afectar la fiabilitat dels resultats la mida dels corpus emprats en la comparació, i atès que s’havia fet servir un volum relativament curt (els primers 5 capítols del Gènesi), s’ha refet la prova triplicant aproximadament el nombre de caràcters de cada idioma tot processant els primers 15 capítols del Gènesi, de manera que les quantitats d’ítems s’igualen entre totes les llengües comparades (entre 30.000 i 40.000 lletres/sons) amb la mida del corpus ibèric (31.939 lletres/sons).

Tal i com deia la teoria, els resultats no s’alteren significativament. Respecte l’ibèric es mantenen tant les posicions relatives com els valors aproximats.

pearson-15-4

Correlació de Pearson vs. l’ibèric amb corpus formats per Gen1-15.

Tampoc la comparativa total presenta canvis de consideració:

pearson-15-tots

Correlació de Pearson entre totes les llengües comparades amb corpus formats per Gen.1-15.

Es manté la mateixa distribució, i per tant es torna a confirmar l’anòmala proximitat entre el desxiframent de l’ibèric i l’eusquera actual.

Donem també les diferències percentuals per cada un dels 12 sons amb el corpus ampliat.

desv-per-15

Diferències percentuals entre 12 sons amb corpus formats per Gen.1-15

La distribució es lògicament força similar, però els detalls de cada so/lletra poden ser interessants per intentar esbrinar on poden estar els errors del desxiframent actual. En aquest sentit,  i ja passava en la prova inicial, la comparativa respecte al català, presenta una simetria curiosa entre les quatre divergències majors. En les vocals, l’escreix de Is de l’ibèric es correspon a grosso modo amb el de les Es del català. I en les consonants, l’escreix de velars de l’ibèric és similar al de les laterals del català.

 

– Actualització 2016-XII-8 –

A rel de la primera comparació, na Carme J. Huertas va plantejar la conveniència de fer-la, no vers el corpus ibèric complert, sinó sols les seves parts més ‘textuals’, mirant d’evitar les entrades que són marques de propietat o sigles, epigrafies d’unes poques lletres, que són moltes i que podrien estar esbiaixant el conjunt. En aquest sentit, una altra quantitat considerable d’entrades del corpus corresponen a monedes, i com que repeteixen formulacions també podrien estar influint excessivament, així que el que finalment s’ha fet, és fer una nova mesura a partir d’una aproximació força dràstica.

S’han rebutjat totes les entrades amb menys de 15 glifs, cosa que ha fet disminuir la mida del corpus ibèric gairebé a la meitat (de ~31.000 a 17.000 lletres/sons) i se l’ha comparat vers la versió ampliada dels corpus de les altres llengües (els primers 15 capítols del Gènesi, entre 30.000 i 40.000 lletres/sons). Tot i així, els resultats globals es mantenen. La distribució més propera a la del desxiframent proposat per a l’ibèric continua sent la de l’eusquera, i ho continua sent per damunt de la del català vs. el castellà. El resultats però no són idèntics. L’ibèric augmenta la ‘distància’ (1-correlació de Pearson) vers l’eusquera i el castellà però disminueix vers el català i el llatí; però tret de la variació versus l’eusquera, són només de qüestions de matís. La gràfica de ‘distàncies’ ho explica millor:

langdist-i15

Distància (1-correlació de Pearson) entre corpus Gen.1-15 i ibèric restringit a >15.

L’anomalia vers l’eusquera es manté (semblen parles contemporànies) i les distàncies amb les altres parles varien només entre 2 i 3 centèsimes. El que sí canvia és la distribució en l’ibèric dels 12 sons/lletres de la reducció.

Amb el corpus complet, ordenant els sons de més a menys freqüents, el resultat era: AIEDGRSNBUOL. Mentre que amb el corpus reduït és: AIEDRBGNSULO, és a dir, es mantenen els quatre més freqüents en el mateix ordre, però canvien posicions els altres vuit, encara que la majoria de canvis són locals (intercanvis de veïns, N-S, L-O) tret de la pujada de labials de novena a sexta posició; i cal remarcar que aquests canvis es donen en un rang percentual molt estret (entre 8.9% i 6.5%, encara no un 2.5% de marge). Gràficament (i mantenint l’ordre del corpus complert per facilitar la comparació):

distchars-i15

Distribucions percentuals  dels 12 sons/lletres amb corpus ibèric restringit a entrades amb més de 15 signes.

I per completar-ho donem també el gràfic de les diferències per cada so/lletra.

deltachars-i15

Diferències percentuals de cada so/lletra amb l’ibèric amb corpus restringit.

On tenim que fins i tot es mantenen els comentaris fets en l’actualització anterior respecte les diferències majors entre el desxiframent de l’ibèric i el català (I vs. E i C/G vs. L) tot i que les diferències menors es reparteixen més.

El que creiem que mostren aquestes dues actualitzacions, aquests dos mesuraments addicionals, és que el que deia la teoria estadística es compleix sense problemes. El colofó, doncs és el mateix que el de la primera mesura: la proximitat entre la distribució de sons actualment proposada per l’ibèric nord-oriental resulta inacceptablement propera a la de l’eusquera actual. Les raons extra-filològiques per uns tals resultats creiem també haver-les fonamentat suficientment en aquest apunt.

 


Notes

Aquesta entrada s'ha publicat en Alcoi, bascoiberisme, Castella, català, cathalaunia.org, coeficient de Pearson, corpus ibèric, Delgado-Hübner, Ebre, estadística, eusquera, freqüències, Gènesi, Gòmez-Moreno, grecoibèric, Ibèria, ibèric nord-oriental, Iberika, Joan Ferrer i Jané, llatí, occità, plom de la Serreta d'Alcoi, R.A.E., Roina, Septimània, tartessos, Tolosa, Turdetània, Unicode, Xúcar i etiquetada amb , , , , , , , , , , , , , , , , , , , , , , , , , , , , , . Afegiu a les adreces d'interès l'enllaç permanent.

Deixa un comentari

Fill in your details below or click an icon to log in:

WordPress.com Logo

Esteu comentant fent servir el compte WordPress.com. Log Out /  Canvia )

Google photo

Esteu comentant fent servir el compte Google. Log Out /  Canvia )

Twitter picture

Esteu comentant fent servir el compte Twitter. Log Out /  Canvia )

Facebook photo

Esteu comentant fent servir el compte Facebook. Log Out /  Canvia )

S'està connectant a %s

Aquest lloc utilitza Akismet per reduir els comentaris brossa. Apreneu com es processen les dades dels comentaris.