2016-novembre a cathalaunia.org

Novembre ha estat un mes instructiu, molt. L’hiatus ibèric que s’obrí inesperadament farà un parell de mesos ha tornat a engolir tota l’activitat del mes. La bona nova és una millora substancial del recull d’epigrafia ibèrica en la part pública i un millor coneixement de la problemàtica de la llengua ibèrica en el vessant personal.

Aquest bloc ha tingut un parell d’entrades noves (la segona amb actualització inclosa) explicant la recerca feta sobre l’escriptura ibèrica. Si hem de resumir-ho, direm que en primer lloc es qüestionà la noció que amb 49 glifs es pogués reflectir la varietat estructural de l’escriptura ibèrica tal i com es desprèn de la proposta de codificació Unicode per l’ibèric nordoriental a base d’emprar el mètode de consignar les co-aparicions de més d’una varietat dels glifs d’un mateix so en una mateixa epigrafia. El resultat era que per mantenir formalment la varietat sígnica caldrien entre 85 i 96 signes diferents. Però en segon lloc, un cop aproximat el grau de variació dels signes, s’anà en sentit contrari, agrupant els sons en 12 sonoritats bàsiques (cinc vocals més set consonants) per tal d’obtenir un registre que fos compatible amb llengües properes (català, eusquera, castellà, llatí) i poder fer una comparació objectiva de les seves distribucions vers la del desxiframent actual de l’ibèric nord-oriental. Els resultats foren espatarrants i es concretaren en un nou article. En un primer moment, es constatà que la proximitat entre l’ibèric i l’eusquera s’enfila fins el 0.9 en un índex estadístic amb un màxim de 1 (el coeficient de correlació de Pearson, on 1=correlació perfecte, 0 = no correlació, -1=correlació inversa) i per tant, es podia pensar que hauria de ser possible un atac purament estadístic al problema de la traducció. Però enseguida es veié que era un factor de correlació excessiu, tota vegada que calculada amb el mateix mètode la proximitat entre el català i el castellà actuals, el coeficient era d’un 0.8 (un resultat certament alt, però lluny de la concordança total, com convé a dues parles parentes, contemporànies i veïnes), o sigui que la distribució d’aquests 12 sons bàsics del desxiframent de l’ibèric de fa 2.000 anys s’assembla més a la de l’eusquera actual que la del català a la del castellà. Un resultat impossible. De manera que donat que de totes les llengües/escriptures mesurades l’ibèric era la única de la qual la sonoritat és tan sols inferida, suposada, calia desconfiar que no fos que el procediment de desxiframent hagués introduït aquesta proximitat excessiva amb l’eusquera contemporani.

La posterior anàlisi històrica d’aquest procés de desxiframent (fet en la primera mitat del segle XX per en Manuel Gómez-Moreno), certifica que certament es furtà completament l’element català i amb ell, la Ibèria dels clàssics grecoromans (la cantonada nord-occidental del Mediterrani) i es primà exclusivament una visió pan-hispànica de gènesi tartèssia amb l’element basc com a arquetip ‘primigeni hispano-ibèric’ i amb una sonoritat reduïda a la intersecció entre el castellà i el basc. El context sociopolític explica perfectament la seva obra, el trist és que seixanta anys després es veu que l’academicisme de la filologia ibèrica encara està prés en una visió ahistòrica filla del nacionalisme espanyol més totalitari (es proclama encara avui en dia, per exemple la unitat de les ‘escriptures paleohispàniques’, un dels axiomes d’en Gómez-Moreno)!

En la banda negativa, estem doncs probablement davant d’un desxiframent parcialment erroni. Adversament, aquest esbiaix sistèmic ajuda a entendre com és que tot i els nombrosíssims contactes detectats entre l’eusquera i el desxiframent actual no s’ha avançat significativament en la seva comprensió i/o traducció. Sabent la causa, potser es podrà corregir convenientment el defecte.

La secció Ibèrica i Romana és la que ha rebut doncs, lògicament, el gruix de la feina del mes. Un dels temes que suscità l’anàlisi de la varietat sígnica de la epigrafia ibèrica nord-oriental, fou la conveniència d’assegurar la correcció dels continguts presentats. El corpus d’epigrafia ibèrica de cathalaunia.org deriva en origen del realitzat prèviament per la Carme J. Huertas i en David Folch (públicament disponible al seu web ibers.cat), que són els que realitzaren la feinada de reproduir totes les epigrafies que coneixien amb un signari convenientment proper als originals (quasi 140 glifs). El que encara no s’havia fet, és una tasca de repàs una a una de les inscripcions. I el primer problema per tal tasca, fou com mirar de fer-la verificable per tercers (per una mentalitat ‘de ciències’, dir que s’ha repassat és no dir res). En aquest sentit, la única opció que semblà tenir possibilitats fou mirar d’incorporar els dibuixos que els arqueòlegs o lingüistes fan de les inscripcions per tal d’evidenciar la proximitat entra la versió codificada i l’original (la fotografia sovint resulta de poca utilitat per aquesta tasca). No és cap panacea, l’ambivalència de moltes epigrafies roman tot i així (els dibuixos també varien segons l’ull de l’expert o la fase de les investigacions, els signes sovint són dubtosos o de lectura múltiple, etc, etc). La solució que es decidí fou incorporar els dibuixos rellevants de cada epigrafia enllaçant-los amb els articles d’on provenen, (una mena de bibliografia gràfica), així, tothom pot veure el grau d’adequació de la inscripció que es presenta i consultar els treballs on s’ha plasmat el seu aspecte (fins i tot en línia, si estan disponible en la xarxa, ja que la bibliografia de cathalaunia.org procura sempre incloure enllaços a edicions que siguin de lliure accés).

Per no allargar la descripció, enumerem les tasques i canvis que s’han aplicat durant el mes.

  • S’ha programat el suport informàtic per afegir aquesta ‘bibliografia gràfica’.
  • S’han incorporat imatges i repassat manualment aproximadament un 40% de les epigrafies.
  • Per millorar la semblança s’han incorporat fins a 8 glifs nous, i en el procés de verificació s’ha detectat i documentat fins 32 signes que caldria encara afegir (la majoria són hàpax legòmenons, però alguns són força freqüents). És a dir, que dels ~140 glifs inicials  es preveu anar fins els ~190. I també s’han ajustat convenientment les eines de cerca en el corpus.
  • S’ha eliminat la part de ‘Codis Iso8859-1‘ de les entrades epigràfiques. En origen era per poder fer copia/enganxa si es tenia el font ibèric creat per na Carme J. Huertas, però la incorporació de nous glifs (absents en el font) en trenca la compatibilitat i s’ha preferit eliminar-la. Si cal, sempre es pot tornar a incorporar més endavant.
  • S’ha corregit un petit error que feia que en mostrar els resultats d’una cerca, si es cercava més d’un patró a l’hora i resultava que es detectaven enganxats en una mateixa epigrafia sols es remarcava el primer.

La reflexió global, d’aquesta immersió inesperada en el món de la epigrafia ibèrica, és que de nou, per una mentalitat ‘de ciències’ l’academicisme de les Humanitats sovint sembla el món al revés; és el que m’agrada conceptualitzar com: la Por a la Taula Periòdica. Si el Fons Cathalaunia i amb ell, el web cathalaunia.org nasqué de comprovar que coses tan simples com un llistat dels documents originals on figuren els nostres prohoms altmedievals no existia (pitjor encara, no existia, ni existeix hores d’ara encara, ni tant sols una llista unificada de tots els documents coneguts – tret de la que es va confeccionant al Fons Cathalaunia, s’entén-!), amb l’epigrafia ibèrica passa quelcom semblant. Ni tant sols hi ha una llista establerta dels glifs que empraren els nostres avantpassats per escriure (hi han reculls diversos, el més esmentat és el de Untermann, però cap de complert i estandarditzat). I el mateix per les epigrafies ibèriques, orfes també de quelcom tant simple com un llistat complert públic i de lliure accés de totes les trobades fins el dia d’avui. La única iniciativa institucional és espanyola i consisteix en la base de dades Hesperia, però els continguts publicats són pocs, i presenta els texts desxifrats, sense la seva forma original (em consta que està previst incorporar aquesta informació, però sembla que falten encara uns anys), de manera que el fet, és que els reculls d’ibers.cat i cathalaunia.org són els únics que miren de presentar públicament un corpus global de l’ibèric nord-oriental amb la informació de les variants originals dels texts. De nou, coses que el sentit comú entén ser bàsiques, com fixar i sistematitzar els corpus a estudiar  (establir els fets, no hauria de ser previ a la teorització?) es deixen per el final! Fantàstic! El resultat és  que cal ser erudit per poder parlar de lo bàsic! El món al revés.

Tant costa entendre que la Ciència avança a base de compartir el coneixement, a base d’establir fets evidents, com per exemple, la Taula Periòdica? És a dir, evitar de totes totes la pèrdua d’esforços en reinventar una i altra vegada la roda (no confondre amb la falta de crítica sistèmica). Les Humanitats però, en dependre més del consens, semblen atrapades en absurdes guerres acadèmiques de natura més social més que no pas científica (amb matisos). Dit cruament: no és que no ho entenguin, és que no interessa, no surt a compte, no importa. A efectes pràctics l’interès per realitzar tasques tan bàsiques e imprescindibles com establir el corpus a estudiar, brilla per la seva absència. Prima el fer bullir l’olla, el dia a dia, i/o els interessos personals o de grup dels experts. Un desespero constant per qui estima el saber.

En l’àmbit de la Bibliografia, les novetats del mes són poques i centrades també en el tema ibèric (la tasca ha estat més de revisió de continguts que no pas de lectura). El resultat és que la subsecció bibliogràfica Ibèrica i Romana s’enfila per sobre de les 800 entrades i es consolida com la segona secció bibliogràfica més ben nodrida del web (i aixo que el vessant romà encara està pràcticament absent!).

Com sempre, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.590 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.
Publicat dins de Carme J Huertas, cathlaunia.org, codificació, comparació de llengües, David Folch, estadística, eusquera, Fons Cathalaunia, Hesperia, Iberika, ibers.cat, Jürgen Untermann, Manuel Gómez-Moreno, signaris ibèrics, Unicode | Etiquetat com a , , , , , , , , , , , , , , | Deixa un comentari

Bascoiberisme circular?

Tot just fa uns dies, en l’apunt anterior, es destacava que havent mesurat en un recent article les distribucions d’una reducció a 12 sons bàsics en una comparativa entre l’ibèric nord-oriental i altres llengües relacionades (tres d’actuals: eusquera, català i castellà i una antiga: el llatí), l’altíssima correlació entre l’eusquera i l’ibèric nord-oriental descartava una semblança ocasional o arbitrària.[1].  És el cas ara de tornar-hi, ja que tot fa pensar que certament la raó no és pas arbitrària, però que tampoc és la desitjada, tota vegada que lluny de poder emprar l’eusquera actual per apropar-se al ibèric nord-oriental, com s’albirava en la part final de l’apunt anterior, estem probablement davant d’un artifici induït per un error metodològic en el procés de desxiframent de l’ibèric nord-oriental. Expliquem el raonament que duu a aquesta conclusió.

L’experiment consistia en reduir les llengües a comparar a dotze sons bàsics: cinc vocals (A, E, I, O, U) i set sons consonàntics ( lateral, fricatiu, velar, nasal, dental, labial, sibilant = L, R, K, N, T, B, S). És a dir, agafar el corpus de l’ibèric nord-oriental per una banda, i un text existent en les altres llengües per l’altra (els primers 5 capítols del Gènesi) i reduir-los tots a aquestes 12 sonoritats, per el simple mètode d’agrupar convenientment els caràcters que formen l’abecedari d’aquests idiomes i recomptar-los. El que fa que pugui funcionar un procediment tan simple, és doble. Per una banda, tenim el fet que tots aquests idiomes comparteixen en gran mesura una mateixa translació lletra-so, i que per tant, un simple recompte ens acosta força a l’objectiu[2], i per l’altra, que en mesurar sols els percentatges de cada lletra/so en cada idioma, ni la diferència de contingut (Gènesi vs. texts ibèrics), ni la mida de cada corpus té un efecte especialment esbiaixant[3].

En un primer moment, l’objectiu era comparar l’ibèric amb aquestes parles, per veure quin grau de proximitat hi havia a un nivell tan bàsic com el de les freqüències relatives dels seus sons principals. Els resultats, van ser claríssims. En un estimador com el grau de correlació de Pearson (on 1 indica correlació total, 0 no correlació i -1 correlació inversa), la comparació entre l’ibèric i l’eusquera actual s’enfilava fins quasi el 0.9, mentre que amb la resta d’idiomes, baixava al 0.6 o menys.

geu-3

Grau de correlació entre l’ibèric nord-oriental i l’eusquera, el català, el castellà i el llatí.

Ara, el dubte que naixia era com valorar aquests resultats, ja que lògicament, la valoració d’un coeficient matemàtic depèn del domini que s’estigui mesurant. Si estem parlant d’objectes geomètrics o matemàtics, una correlació de 0.9 pot ser un grau baix si s’esperava identitat, per contra, en temes socials, un 0.8 usualment ja es pot considerar un valor alt, tota vegada que a priori el que s’està comparant té menys probabilitats de respondre a una relació geomètrica (que es el que de fet mesura el coeficient). En altres termes, era 0.9 un grau de correlació propi de… dialectes?  De llengües germanes? De…?

La dificultat semblava estar en trobar estudis filològics quantitatius que haguessin fet una mesura lo prou semblant com per establir algun criteri comparatiu fiable. Però la resposta estava més a prop del que s’esperava. Havent fet la comparativa d’aquestes quatre llengües amb l’ibèric nord-oriental, fer la mateixa comparativa entre totes ells, era gairebé trivial (la feina feixuga ja estava feta). De manera, que es completà la comparança, amb les parelles que no havien estat considerades en l’experiment inicial. Cinc llengües ens donen deu possibles parelles, les quatre de la gràfica anterior i sis més. Gràficament:

pearson10

Correlació de Pearson de les freqüències relatives entre l’ibèric nord-oriental, el català, l’eusquera, el castellà i el llatí reduïts a 12 sons bàsics.

Aquesta simple gràfica, d’aspecte aparentment anodí ha acabat obrint la caixa dels trons (metafòricament parlant).

Fixem-nos d’entrada tan sols en els dos valors més alts: la correlació entre ibèric-eusquera (~0.9) i entre català-castellà (~0.8). Que la correlació entre dues llengües contemporànies, veïnes i romàniques, o sigui, emparentades, sigui clarament inferior a la que hi ha entre una llengua desapareguda fa 2.000 anys i una d’actual com l’eusquera resulta pràcticament inexplicable. És que 2.000 anys han passat sense modificació per l’eusquera? Era llavors encara més semblant a l’ibèric (i en aquest cas estaríem pràcticament parlant de identitat) i sols s’han separat aquest 0.1? Sembla una casualitat astronòmica que comparant dues parles separades per dos mil·lennis (i una d’elles desapareguda des de llavors) la correlació sigui significativament  més alta que la que hi ha entre parles més properes, contemporànies, veïnes i emparentades com el català i el castellà. No té sentit.

Posem un exemple concret per mirar de visualitzar millor aquests coeficients aplicats al domini que estem tractant. Fem un experiment imaginari, suposem que el castellà fos la llengua desconeguda (escrita en glifs allunyats de les nostres lletres i sense espais entre paraules) i que en un procés de desxiframent n’hem arribat a confeccionar el seu mapa sonor (i que a més, és tal i com tots realment ho coneixem). Agafem un text curt com el del primer dia de la creació del Gènesi, i el reduïm als 12 sons bàsics de la metodologia de comparació; tindríem això:

ENELCONIENSOTETOTOTIOSKREOELKIELOILATIERRA:
LATIERRANOTENIAENTONKESBORNAALKUNATOTOERAUNNARBROBUNTOKUBIERTOTEOSKURITATIELESBIRITUTETIOSSENOBIASOBRELASAKUAS:
TIOSTIIOAIALUSIUBOLUS:
ALBERTIOSKUELALUSERABUENALASEBAROTELAOSKURITATILALLANOTIAIALAOSKURITATLALLANONOKE:
TEESTENOTOSEKONBLETOELBRINERTIA:[4]

És a dir, hauríem arribat a la conclusió que aquells signes sonaven més o menys així (recordem que representa que el castellà ens és desconegut). Algú es creu que s’hauria tardat gaire a llegir el seu contingut des del català (evidentment, ignorant que és un text de vell antuvi ben conegut per a nosaltres)? No són les semblances notòries? Doncs això es dóna entre llengües amb un coeficient de correlació de 0.8[5], quan més properes haurien de ser si fos de 0.9? Ja que això és el que es mesura entre l’ibèric nord-oriental i l’eusquera actual. És aquí que cercant l’explicació més simple,  neix una sospita ‘horribilis’.

I si aquesta proximitat excessiva és deguda a un esbiaix metodològic en el procés de desxiframent que ha primat innecessàriament els paral·lelismes amb l’eusquera?

Dit d’altra manera, la màquina, el recompte, ens dóna eusquera com a més proper a l’ibèric, per el simple fet que li hem ficat eusquera abans, en el procés de desxiframent. D’aquí el circular del títol de l’apunt, ja que estaríem davant del mateix fenomen del raonament circular on l’efecte es torna causa.  I anant al detall del cas, cal entendre que el procés de reducció a 12 sons bàsics elimina (ja que unifica) les disquisicions més modernes sobre l’escriptura ibèrica, com la diferenciació entre sil·làbics forts o fluixos, la duplicació de les vocals o el só d’alguna nasal. La semblança hauria de provenir de l’esquema bàsic, forjat – si no vaig errat – en la primera mitat del segle passat. El mapa que en Gòmez-Moreno el 1922 atribueix al sistema Delgado-Hübner (reeditat el 1949) , ja recull l’estructura bàsica que comporta aquest grau de correlació excessiu.

Però anem més enllà i tornem a la gràfica de la comparativa global. Si ens hi fixem, les correlacions entre les tres llengües modernes (el català, els castellà i l’eusquera) formen el gruix de la part alta de la gràfica, ja que ocupen el segon, tercer i quart lloc, mentre que les correlacions que inclouen parles antigues, el llatí o ibèric, formen les sis posicions inferiors de la gràfica. És a dir, tant el llatí com l’ibèric, difereixen més respecte les parles modernes (i entre sí), que no pas les modernes entre sí, fet que resulta lògic si pensem que el pas del temps hauria de tendir a evolucionar, i per tant, separar dels seus origen a les parles. Excepte però, en el cas de l’ibèric vs. l’eusquera actual, que no sols no està en la part baixa (com es podria esperar), sinó que és el màxim destacat de totes les correlacions possibles. Una anomalia en tota regla.

Podem mirar de plasmar-ho en un dibuix, prenent el complement de les correlacions (el que falta fins 1) com una ‘distància’ entre les llengües (al no formar una mètrica no es poden satisfer totes les longituds, de manera que no és més que una aproximació, caldrien quatre dimensions com a mínim per disposar-ho com cal).

langdist

Distància (1-correlació) entre llengües.

On veiem que el llatí està convenientment separat de les llengües modernes (en groc), però que l’ibèric, tot i estar a una distancia semblant a la del llatí respecte al català i el castellà, està però anòmalament  a prop de l’eusquera. Si pensem que la filiació ha de tendir a apropar i que la distància temporal tendeix a allunyar, podríem explicar perfectament la relació del llatí amb les altres llengües, però en el cas de l’ibèric falla en la proximitat amb l’eusquera, que faria creure més aviat que són contemporànies. I sent l’ibèric la única llengua de les cinc mesurades de la qual no coneixem de primera mà la seva sonoritat original,  no sembla difícil pensar, com dèiem, que l’anomalia neix degut a què la proposta actual ha estat modelada a partir de l’eusquera modern; el raonament circular que dèiem. Caldria confirmar si el bascoiberisme no sols ha procurat traduir l’ibèric, sinó que abans, n’ha estructurat preferencialment el seu desxiframent.

Vol dir això que el desxiframent actual està tot malament i que els nombrosos punts de contacte amb el basc són tots miratges? Doncs probablement no, però el problema més urgent, seria potser mirar d’entendre on es va torçar innecessàriament vers l’eusquera. Va ser en la definició del mapa sonor ibèric (inevitablement perdut en el temps, tret de pervivències en llengües actuals com el català o el propi eusquera)  i/o en la projecció d’aquest mapa sobre la seva variada representació sígnica?

Lamentant-ho molt, s’ha de deixar la qüestió oberta, aquí. No sabria pas dir si és que hi havien més  sons en origen (o diferents), o si es tracta sols de què la seva assignació als signes és defectuosa. El que sí potser podria ajudar a explicar aquesta anomalia estadística, és la raó del fracàs dels intents de comprensió de la llengua ibèrica a partir de la basca.

Si hi han noves s’aniran afegint al fons en forma d’actualitzacions…

 

– Actualització 2016-XI-23 –

Una breu recerca en la història contemporània ha permès respondre fàcilment les preguntes que es feien al final de l’apunt (per algú acostumat a l’alta edat mitjana, quin luxe això de poder disposar de documentació abundant…!). En Gòmez-Moreno explicà en primera persona el procés de desxiframent de l’ibèric (per exemple a: Gómez-Moreno, Manuel : 1943 : “La escritura ibérica y su lenguaje” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.257-281) i la bibliografia és força abundant[6]. Els resultats, com acostuma a passar en l’estudi de la Història, superen les expectatives, de llarg.

Per dir-ho de forma abreujada: no fou el bascoiberisme el que dirigí el procés de desxiframent de l’ibèric, fou el nacionalisme espanyol.

De entrada, ja va semblar estrany que un personatge amb un perfil sociològic com el del granadí Gómez-Moreno hagués propiciat una lectura bascocèntrica[7], però el fet, és que tal era el discurs del nacionalisme espanyol del moment (i en bona part, encara ara ho és) que reconeixia l’element basc com a propi i representatiu de les seves essències primigènies. Ho diu amb totes les lletres en el seu discurs del 1942 d’accés a la R.A.E:

“Si oimos hablar a un francés, lo diputamos extraño a nosotros por su acento, y si le medimos el cráneo se confirma el hecho.
Pero si oimos la lengua vascuence nos suena tan a nuestro que la acogemos gustosos. Y, de hecho, ahí está el hombre vasco, el ibero, pesando sobre nuestra historia, con su mentalidad no conformista permanente, su inquietud; hoy, guerrillero, ayer, en aventuras de mar, antes, soldado a merced de Roma, por Italia y Sicilia, sin apegos fuera de lo suyo; y ahí le tenéis conservando su hombria de bien, tanto como su encortezada fiereza.”

I és que si mirem el que deia vint anys abans, quan plantejà la seva teoria, la proximitat que hi veia amb el basc era ben palesa (Gómez-Moreno, Manuel : 1922 : “De epigrafia ibérica. El plomo de Alcoy” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.219-231):

“El desvio singular a poner consonantes oclusivas ante continuas, la alternación frecuentísima de unas y otras, escasez de sordas y falta de aspiradas, que pone de manifiesto el plomo alcoyano, prestaria cierta suavidad y ritmo a su lenguaje, cual hoy mismo lo conserva el vascuence; y es muy notable que iguales caracteres parecen regla en la onomástica nuestra primitiva, como si ello constituyese algo típico del iberismo.”

Tot i que ja remarcava llavors que la distància temporal feia inviable els intents de traducció:

“El aspecto externo parece convidar a una asimilación; sin embargo, ni es posible definir que el vasco actual sea como el de ha veinticuatro siglos, ni que dejase de haber variación, y quizá grande, entre el habla de los Pirineos y la de Alicante, aun suponiendo un origen comun para ambas.”

Sembla increïble que un segle més tard, encara s’estigui, bàsicament, al mateix lloc! Però arribats aquí, cal preguntar-se com s’ho feu en Gòmez-Moreno per desxifrar l’ibèric amb el motllo basc sense adonar-se’n? I la resposta que apareix és terrible, per tautològica. Ho feu a base d’ignorar sistemàticament l’element català, i per extensió, arribar a ignorar fins i tot la Ibèria de les fonts preromanes, que la identifiquen clarament com la cantonada nord-occidental del mediterrani, i emprar exclusivament una mirada històrica esbiaixada per el nacionalisme espanyol.

En aquesta mirada, com ja varem comentar en l’apunt anterior, Ibèria tenia el seu començament en la Turdetània (o Tartessos) i era un fenomen autòcton de la península; com a molt, posats a buscar un origen, seria africà (les semblances amb el berber, la teoria de Schulten, etc). I les escriptures ibèriques, havien de derivar totes de la tartèssia per el simple fet de ser aquesta la més antiga. Si calia cercar un substrat, quelcom ‘primitiu’, havia de ser el basc, el català ni s’esmenta, i és que no era políticament correcte. Es pot constatar, de nou, en el seu discurs de l’any 1942, on repassa lloant totes les ‘llengües hispàniques’ però la paraula ‘català’ ni hi surt; sols en parla en el penúltim paràgraf:

“Otras fuerzas periféricas penínsulares, aunque pesen muy mucho, actuaron menos a gusto, en virtud de su orientación hacia el exterior y su autocentralismo peculiar; fieles a nuestra tesis, con oir el habla de Barcelona, Valencia y Lisboa nos damos cuenta de que factores extraños les prestaron su acento.”

Queda clar, no? Països Catalans i Portugal no són ‘hispànics’. Són estrangers, han estat alienats en algun moment indeterminat…! Tot i que la principal peça evidencial que emprà per fer el desxiframent fou el plom de la Serreta precisament d’Alcoi (un text ibèric del segle VIaC escrit en grecoibèric, és a dir, una mena de pedra de Roseta per el que fa al desxiframent), el català no podia ser cap mena de referent! En tota la seva obra que hem pogut llegir falta l’element català, l’iberisme mediterrani és com si no existís i no proporcionés el gruix de les evidències epigràfiques. Els ibers de les nostre terres, els de la costa entre el Xúcar i el Roina, no existeixen, no tenen perfil lingüístic propi, la seva escriptura és una extensió tardana (s. III aC) de la tartèssia (de fet, la descriu com la seva fase pòstuma), i s’oblida premeditadament el rol preferent que consta en els clàssics. Com a molt, imagina uns pobles primitius entre l’Ebre i els Pirineus on hi hauria un aglomerat de pobles que parlarien el basc de fa 2.400 anys[8].

Hom pensaria que tals desviacions haurien estat corregides fa temps, però no, la tesi d’en Gòmez-Moreno encara és la oficial, i la unitat de les escriptures ibèriques es proclama per exemple en les propostes de codificació per a Unicode de la UB de l’any passat, i aquesta mateixa desproporció evident en obres del segle passat es pot trobar encara en obres modernes de referència que apliquen la mateixa mirada pan-hispànica unificant, i on el sud de la península rep usualment el gruix de l’atenció. De fet, fins ara, no he tingut la sort de trobar cap treball que proposi l’ibèric com substrat del català/occità. Ho he sentit expressar públicament per experts de món de l’arqueologia ibèrica, però no he llegit cap proposta concreta, el que sí he vist és dubtar de la filiació exclusiva del català amb el llatí.

Entrant més en detall, ens preguntàvem també si l’error sistèmic d’en Gómez-Moreno estaria en la definició del mapa sonor, o sols en l’assignació dels glifs. També això té resposta.

Aplicant la tautològica filiació iberico-turdetana i l’exclusió de l’element català, el mapa sonor del que partí el granadí, es basà en la part congruent entre la sonoritat del castellà i del basc[7b] . D’aquí, per exemple, les cinc vocals, o la necessitat d’absència de p en l’ibèric, i la tant esmentada absència de muta cum líquida (oclusiva seguida de l o r) i d’agrupacions consonàntiques. Per tant, el mapa sonor que emprà, mancava d’elements freqüents en la nostra parla[9], i el conduí a proposar el sistema semisil·làbic per les oclusives, que forma l’estructura més idiosincràtica de la seva proposta (les vocals i altres consonants, s’havien derivat majoritàriament de monedes i toponímia comparada). En Gòmez-Moreno era ben conscient de les semblances amb el basc del seu sistema: de “La’escritura ibérica y su lenguaje” p.270.

“La ausència de letras muda y líquida seguidas es muy esencial en lo ibérico, de acuerdo con las lenguas semíticas y también con los dialectos vascos, lo que decidió probablemente la organización de su escritura, y ello a partir del silabismo, punto en que hemos de basarnos necesariamente.”

Resulta curiós que explicant-ho en primera persona, reconeix que trobant-se en la transcripció del plom d’Alcoi amb elements no coincidents amb la seva disposició, com paraules acabades amb oclusives sordes (que els trobem per exemple en el català i juntament amb grups consonàntics, en moltes llengües indoeuropees), els descartà de vell antuvi (del paràgraf abans de la cita anterior):

“En Alcoy aparecen anomalías en fin de palabra, con sílabas cuya última consonante es oclusiva (gik, ok, lirg, bind, bask), coincidiendo con empezar por b la palabra siguiente, salvo una vez que es una s.”

És a dir, tot i que el seu propi sistema no funciona del tot en la pièce de résistance sobre la qual construirà el semisil·labisme ibèric (en un text de 46 paraules, tenim fins a 8 casos: baśk, bagaŕok, leguśegik, tebind, tagisgaŕok, gaibigait, śalirg, boiśtingiśdid, és a dir, una de cada cinc o sis), aquestes incongruències no tenen més consideració que ser ‘anomalies’, sense cap altre efecte.

Tenim doncs per una banda un mapa sonor restringit, aplicat per igual a tot el territori peninsular i a la totalitat de testimonis epigràfics i amb una projecció sobre el signari basada en un semisil·labisme no plenament concordant amb l’evidència, però que recorda al basc (naturalment, del segle XX) com reconeix el propi autor. I per l’altra, tenim un signari que sense haver estat prèviament sistematitzat, es agrupat en conjunts que acorden amb la teoria fonètica prèvia i amb glifs identificats entre les escriptures del mediterrani oriental (en això, en Gòmez-Moreno sostenia una filiació del tartessi més plural que la estrictament semita). El propi autor en dóna la seva disposició a: “La’escritura ibérica y su lenguaje” p.274:

gmm

Les agrupacions de glifs d’en Gómez-Moreno. 89 glifs en 28 categories.

Fins a 28 categories fonètiques amb un total de 89 glifs, que és una distribució pràcticament idèntica a la proposta actual (si considerem que no està desdoblant els sil·làbics) i que provoca la proximitat estadística amb el basc actual. Resulta interessant que el nombre total de glifs que recull cau dins la forquilla de 85-96 de l’estimació quantitativa feta a partir de les co-aparicions (tot i que no són els mateixos glifs).

O sigui, que si recapitulem, en Gómez-Moreno no modelà probablement l’ibèric sobre el basc a posta, sembla que fou més aviat un resultat induït per el reduït mapa sonor que contemplà acríticamen, sumat a la simplificació que feu de la sonoritat del plom d’Alcoy a quelcom que reconeixia com proper al basc al que considerava element ‘primitiu’ o primigeni. En l’assignació dels signes, seguí un procés de selecció eclèctic, les vocals, les consonants continues, i algunes síl·labes amb oclusiva ja havien estat apuntades prèviament, i en arribar a idear el model semisil·làbic sistematitzà els signes que faltaven amb referents d’escriptures del mediterrani oriental. El resultat és la proximitat estructural que propicia l’anòmala (per alta) correlació estadística entre els sons de l’eusquera actual i els de la seva proposta de desxiframent de l’ibèric.

De manera que no, el bascoiberisme no provocà les semblances estructurals del desxiframent de l’ibèric amb l’eusquera actual com podia semblar a primer cop d’ull en constatar que la proposta de desxiframent actual de l’ibèric fa que sigui més semblant al basc del segle XX que no pas ho són entre sí el català i el castellà contemporanis. Ho feu la visió ahistòrica filla del nacionalisme espanyol que preferí ignorar l’element epicòric del gruix de l’escriptura ibèrica i en reduí el seu mapa sonor a lo més simple a partir de la intersecció del basc i el castellà (5 vocals, no muta cum liquida, no p,etc), tot i que l’evidència filològica no era plenament coincident i que l’esbiaix històric era més que evident. El context sociopolític del moment permet explicar-ho, el que no sembla de rebut és que no hagi estat convenientment corregit.

Tenim doncs probablement un sistema parcialment correcte, però al que hi falten possiblement sons i on la interpretació fonètica dels signes sembla clar que tampoc és completa (per començar, si més no, no lo prou com per donar raó del plom d’Alcoi). L’aportació moderna quantitativament més important (inclosa en el resum que presenta la proposta Unicode[10]) potser sigui el desdoblament de les vocals en l’ibèric nord-oriental, que va clarament en la línia que diem d’ampliació del mapa sonor original, tot i que la seva anàlisi és encara parcial i pobrement evidenciada[11]. Sumem-li els finals amb oclusiva del plom d’Alcoi i tal vegada estiguem davant d’un sistema de representació més flexible i aproximatiu, on potser alguns sil·làbics també poguessin representar el so consonàntic pur, més que no pas la rigidesa de la interpretació sil·làbica actual? No cal multiplicar les especulacions aquí…

Que la parla de fa 2.000 anys del mediterrani occidental tingués una semblança amb el basc d’avui en dia és una possibilitat, però que fos encara més gran que la que hi ha entre els actuals català i castellà, no. Com també sembla lògic que si en algun lloc la parla dels ibers de les fonts grecoromanes hagés pogut deixar una empremta és en les seves pròpies terres i en les parles dels seus habitants, és a dir, simplificant, les nostres, les que actualment aproximadament coneixem com els Països Catalans, la Septimània i Tolosa i en el substrat de la seva llengua pròpia: el català/occità. Terres i cultures que han evolucionant de forma conjunta al llarg del segles per damunt, o si es vol, a través de, les seculars vicissituds polítiques i que parlant de llengua, després de més de mil anys de romanització produiran la parla catalano/occitana. Consideració epicòrica, però, que ha estat furtada en el desxiframent de l’ibèric.

 


Notes

Publicat dins de Alcoi, bascoiberisme, Castella, català, cathalaunia.org, coeficient de Pearson, corpus ibèric, Delgado-Hübner, Ebre, estadística, eusquera, freqüències, Gènesi, Gòmez-Moreno, grecoibèric, Ibèria, ibèric nord-oriental, Iberika, Joan Ferrer i Jané, llatí, occità, plom de la Serreta d'Alcoi, R.A.E., Roina, Septimània, tartessos, Tolosa, Turdetània, Unicode, Xúcar | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | Deixa un comentari

Malcodificacions ibèriques i semblances amb l’euskera.

Aquest apunt és com un tutti frutti, d’entrada és una mena de continuació de dos apunts previs: Malcodificant l’ibèric nord-orientalEls caràcters de l’ibèric nord-oriental, i acaba demostrant estadísticament la proximitat de l’ibèric amb l’euskera.  En el primer apunt es comentava com la proposta de codificació de l’ibèric nord-oriental per a Unicode havia reduït els nombre de caràcters a poc més 50 (puntuacions incloses) quan en els originals es poden detectar més del doble de glifs diferents, i en el segon s’analitzaven quantitativament la co-presència de glifs al·lògrafs en una mateixa epigrafia i es postulava la necessitat de diferenciar no entre 50, sinó entre 85 i 96 signes diferents.

Ja fa uns mesos, que processant el darrer volum de la revista Paleohispànica (el de 2015), va cridar l’atenció un article dels mateixos autors que la proposta per a Unicode (el grup LITTERA de la UB): Ferrer i Jané, Joan + Moncunill, Noemi + Velaza Frias, Jesús Javier : 2015 : “Towards a systematisation of paleohispanic scripts in Unicode. Systhesising multiple transcription hypotheses into two consensus encodings” : Palaeohispánica – revista sobre lenguas y culturas de la Hispania antigua : 15 p.13-55. I unes setmanes més tard, es tenia accés a la proposta del mateix grup per les llengües preromanes del sud de la península ibèrica: Ferrer i Jané, Joan + Moncunill, Noemi + Velaza Frias, Jesús Javier : 2015 : “Preliminary proposal to encode the southern paleohispanic scripts for the UNICODE standard”.

La lectura d’aquests dos darrers treballs va despertar uns quants dubtes no pas menors:

  1. Es declara que en utilitzar els mateixos caràcters que l’ibèric nord-oriental, el celtibèric, no requereix de cap entrada pròpia en l’estàndard Unicode.
  2. Es diu que totes les llengües escriptures ‘hispàniques’ ‘paleohispàniques’ tenen un mateix origen.
  3. A semblança de l’ibèric nord-oriental, es codifiquen (conjuntament) el tartessi i l’ibèric sud-oriental en 48 entrades noves (code-points en terminologia codicològica).

Ja en la lectura del primer article vaig mirar de preguntar si havia realment entès bé aquests punts, i efectivament, la resposta va ser que sí. Posteriorment amb la lectura de la proposta de codificació del tartessi i del ibèric sud-oriental, vaig comprovar que efectivament, el mateix criteri reductor que s’havia aplicat a l’ibèric nord-oriental, s’aplicava també a aquelles escriptures conjuntament.

tartes-sud-est-1

Els 48 caràcters del tartessi i de l’ibèric sud-oriental en la proposta per a UNICODE.

No sabent pràcticament res en detall de les escriptures del sud de la península, vaig aprofitar les descripcions que es donen en la proposta per a Unicode, ja que són excel·lents per entendre la posició acadèmica actual. El problema és que quan més llegia menys entenia, i els dubtes, en comptes de disminuir s’incrementaven.

Al cap de poc temps, es va mirar de fer bona la proposta de codificació de l’ibèric nord-oriental i comprovar en el corpus d’epigrafia ibèrica de cathalaunia (l’únic actualment publicat, juntament amb el de na Carme Huertas i en David Folch, del qual deriva, que detalla quina variant de cada signe figura originalment en les inscripcions) si efectivament amb els 49 signes de la proposta es podia donar raó de la particularitat de totes les epigrafies. És a dir, si la teoria era correcta, mai (o casi mai) s’hauria de trobar dues variants d’un mateix signe de la proposta en una mateixa inscripció ja que això seria senyal que en origen es diferenciaven coses que en la nostra teoria actual  haurien de ser equivalents. Però ja tot just començar va quedar clar que això no era pas així, de manera que vaig tornar a demanar ajut als experts per veure si estava cometent algun error sistèmic que podés donar raó a la magnitud de la discrepància. Posteriorment, en acabar el recompte, els resultats, eren quantitativament, força similars al repertori de 95 signes definits per Untermann, de manera, que potser s’havia verificat  mecànicament, de manera aproximada , el que el filòleg germànic havia recopilat prèviament de forma manual. La discrepància amb la proposta per a Unicode estava servida.

Així que en aquest apunt parlarem dels tres dubtes anteriors, dels comentaris dels experts, i anirem una mica més enllà en la problemàtica de l’ibèric nord-oriental. Tot plegat, un totum revolutum al que mirarem de donar alguna il·lació que tingui sentit.

Lenguas hispánicas

Per començar, un apunt aïllat. En aquests dos articles esmentats del grup LITTERA, tot i que com hem dit, parlen del celtibèric (per negar-li cap especificitat que necessiti codificació), no s’esmenta, ni en la bibliografia, un treball previ del 2011, que ja havia estat citat en aquest bloc: Olcoz Yanguas, Serafin + Medrano Marqués, Manuel : 2011 : “Una propuesta de normalización de la escritura celtibérica” : Veleia – revista de prehistoria, historia antigua, arqueología y filología clásicas : 28 p.141-160. Entenent que els autors són experts en la matèria em resultà inexplicable (deixem-ho així) l’absència de tota referència a un precedent tan explícit.

celtiber-1

La proposta d’Olcoz i Medrano per l’ibèric incloent variants celtibèriques.

Però més enllà d’aquest detall, és evident que hi han signes que no es corresponen, variants si es vol d’un mateix so, però especificitats al cap i la fi, que la proposta de codificació esborra, tant per el que fa a l’adaptació celtibèrica com per els signaris meridionals. De tirar-se endavant, i em consta que no hi ha voluntat de canviar substancialment les propostes fetes, l’única opció de representar amb tecnologia informàtica estàndard els signes originals seria a base de fonts tipogràfiques alternatives. Com si per escriure amb majúscules, o amb accents en les llengües modernes, haguéssim d’emprar una font diferent per cada ‘variant’: una per majúscules, una altra per accents oberts, una més per tancats, i així anar fent. Oi que no té sentit? Doncs exactament per això Unicode no reconeix la ‘A’ majúscula com una variant de la ‘a’ minúscula (o viceversa), sinó que li atorga a cada glif un codi propi i els considera ‘caràcters’ diferents. En el cas de l’ibèric, no sabem a què responia aquella varietat sígnica, el que no sembla de cap manera raonable és esborra-la com si no existís! Però aquest punt ja el varem comentar en l’apunt sobre la codificació de l’ibèric nord-oriental, i a més, hi tornarem més endavant…

El que sí es detecta en la literatura filològica ibèrica, és una voluntat política uniformitzadora en la mirada al món ibèric, que no és en cap cas nova, ni tampoc innocent (potser inconscient en certs casos) però fàcil de detectar i de descriure. El cas del l’eliminació del celtibèric en la codificació seria un símptoma menor, un altra seria l’abandó de la nomenclatura original d’aquestes llengües, que les diferenciava per origen segons els clàssics (tartessi, ibèric, celtibèric, -l’ibèric meridional va ser detectat modernament-) per una denominació ‘ibèrica’ unificadora (nord/sud/oest),  també ho és la insistència en una localització estrictament peninsular (ignorant les evidències al nord del Pirineus!),  però potser on es mostra més clarament és en la temàtica dels orígens d’aquestes escriptures.

Comencem per l’anacronisme garrafal, i no per això menys repetit, de parlar de ‘llengües hispàniques’ per referir-se a realitats preromanes (com si Hispània no fos un terme romà!). Potser a mitjans del segle XX, quan es formà la teoria que considera el tartessi com l’escriptura mare de la resta d’escriptures preromanes peninsulars, en un context polític de dictadura franquista, es podria excusar que els erudits autors d’aquesta teoria, i que són els mateixos que fonamentaren el desxiframent actual, parlessin repetidament de ‘lenguas hispánicas’ i projectessin una unitat patriòtica espanyola ideal al passat més reculat en un pan-hispanisme/iberisme peninsular nascut en el sud-oest en el primer terç del primer mil·lenni abans de Crist. Eren els signes dels temps, certament. La teoria de l’origen africà del ibers també havia estat defensada entre altres per l’arqueòleg germànic Adolf Schulten (un enamorat de Tarragona, només cal llegir els seus treballs), i resultava plenament coincident amb els plantejaments d’un dels pares de la filologia ibèrica com Manuel Gómez-Moreno[1]. Però tal ideologia continua viva encara en els nostres dies, molt especialment en la forma del que avui en dia en diem nacionalisme banal, sols cal comprovar quanta gent, amb estudis, no pas analfabets, confonen el sentit de: península ibèrica i Espanya. No és gratuït, és induït.

L’apropiació interessada de conceptes del passat per part de la política és gairebé una constant. En aquesta cas, es vol confondre el terme administratiu[2] Hispania aplicat a la península de l’extrem occidental d’Europa per els romans com el solar nadiu i ancestral d’una unitat política mai existent en la història coneguda[3] i s’ignora convenientment la descripció prèvia dels grecs que segles abans (s. VI aC) localitzaren els ibers en la costa a l’oest del Roine i que posteriorment, quan s’aprecià que l’occident europeu tenia forma de península, la qualificaren com ‘ibèrica’, en relació probablement al poble que amb el que hi tenien més tracte, els ibers, sense que per això es parlés de cap unitat amb la resta de pobles riberencs coneguts per ells: els turdetans o tartessis en la zona de l’estret i els celtes en les costes atlàntiques, com a mínim fins les illes britàniques.

Certament, hem de pensar que els filòlegs actuals són contraris a aquesta mena de manipulacions barroeres del passat, i que basen les seves conclusions en evidències científiques. El problema sembla ser que en el tractament dels aspectes històrics, fan aigües i sovint es defensen posicions metodològicament insostenibles. Un exemple concret: en una de les obres de referència on es defensa la filiació a partir del tartessi, es considera que l’ibèric meridional, amb clars punts de contacte tant amb el tartessi com amb l’ibèric nord-oriental, ha de ser anterior al nord-oriental. El petit detall que l’evidència no ho corrobora, és ignorat, i a l’hora de datar l’ibèric meridional, es fa servir l’evidència més reculada del nord-oriental per afirmar que és anterior a tal data! Un raonament plenament circular. Es parteix d’una suposada derivació del tartessi, i com que el nord-oriental és demostrablement anterior al sud-oriental, aquest ha de ser encara més reculat, sense cap evidència[4]! Quelcom semblant tenim en les lectures ahistòriques i essencialistes que miren de minimitzar el pes de les influències exteriors i afavorir per contra una mirada localista, autòctona. Un exemple palmari seria les malinterpretacions que en aquestes obres de referència sobre paleofilologia ibèrica es fan dels testimonis de l’origen dels ibers segons els clàssics, on s’arriba a escriure que en Varró digué que els ibers eren autòctons, quan de fet, diu el exactament el contrari, els esmenta com la ocupació mes reculada, seguida per els perses,  fenicis, celtes i púnics abans dels romans[5]. Sembla ben be allò de no deixar que els fets esguerrin una bonica teoria!

Si hom però obre el focus, i contempla el conjunt, tal hipòtesi unitària resulta, a més, completament espúria. Cap clàssic parla de cap unitat. Tartessos i Ibèria són dues realitats fàcilment discernibles en la mirada històrica (completada per una Cèltica en les llunyanes costes oceàniques), i la teoria d’una una suposada difusió per via terrestre de l’escriptura tartèssia, per donar lloc presumptament a l’ibèric sud-oriental i d’aquest al seu torn al nord-oriental, no té cap mena de lògica si recordem que els contactes marítims són la norma (més en contexts tan propers, tota vegada que viatjar per aigua és molt més eficaç que fer-ho per terra[6]). La realitat acostuma a tenir un grau superior de complexitat.

Ara, ho diuen en va doncs, això de la unitat de les escriptures preromanes? Doncs no, de cap manera, ho diuen bàsicament per raons filològiques. Mirem d’explicar la posició actualment difosa.

Tal i com es resumeix en les propostes de codificació Unicode, del tartessi, tenim un centenar d’inscripcions datades entre els segle VII-IV aC, de l’ibèric nord-oriental més de dos mil que oscil·len entre el segle VaC-IdC, de l’ibèric sud-oriental una setantena d’exemples entre els segle IV-I aC i del celtibèric dues-centes inscripcions fetes entre els segles IIIaC-IdC. L’escriptura més antiga és doncs la tartèssia, propera a la posterior i veïna sud-oriental, amb la que comparteix una dependència clara dels signaris semítics (hi ha un signari ‘intermedi[7]‘ que presenta grups de signes contigus en el mateix ordre que els signaris orientals (que són molt anteriors). En l’ibèric nord-oriental els signaris que s’han trobat, són molt diferents i no mostren aquesta dependència (tampoc és que mostrin un model alternatiu, ja que les evidències fins ara trobades, encara que sí comparteixen algunes seqüències  de signes[8], difereixen entre sí).

Si el tartessi i el nord-oriental són tant diferents però propers en el temps, perquè es diu que són derivats? Doncs perquè tots ells comparteixen un tret comú: el fet de ser semisil·làbics (per les labials, dentals i velars). Així, es suposa que fou l’adaptació d’un signari eminentment consonàntic com és el semític a una parla amb menys consonants la que generà aquests signes sil·làbics[9]. El problema d’aquesta hipòtesi és que en els signaris ibèrics, que no en el tartessi, es detecta que inicialment s’emprà un sistema semisil·làbic dual que diferenciava gràficament entre sons forts/dèbils (G/K,D/T) i que posteriorment es simplificà. O sigui que si disposem temporalment els fets, tindríem un signari semisil·làbic no dual al segle VII en zona tartèssia, un de dual dos segles més tard en les nostres terres, i quelcom semblant dos cents anys més tard en la part est de l’actual Andalusia (i és de remarcar, en el sentit de mostra de voluntat de diferenciació social, que sembla ser que tot i compartir l’existència de signes duals, la interpretació so fort/so dèbil, era inversa, i el que al nord indicava so fort al sud indicava so dèbil i viceversa[10]). Un altre element que complica, si més no aparentment, el panorama, és que els glifs d’aquests sons semisil·làbics són parcialment diferents entre l’ibèric nord-oriental i el tartessi (comparant les codificacions tenim que entre els signes identificats, difereixen: bi,ke,ki,te,ti,to, i coincideixen únicament: ka,ko,ta,tu), i per tant, mal es pot defensar un pas global d’una banda a una altra, de l’extrem sud de la península als Pirineus orientals, en qüestió de 200 anys (i amb la dificultat afegida que no es detecta una fase formativa en l’ibèric nord-oriental, que apareix ja de vell antuvi amb la seva màxima complexitat).

cod-iberic-dual

La proposta de codificació per a UNICODE de l’ibèric nord-oriental.

Però el que resulta més cridaner a un ignorant, potser sigui el poc paper que es dóna a la possibilitat d’una transmissió per l’altra gran grup cultural mediterrani preromà, el d’origen greco-minoic, especialment, si recordem que un dels fundadors de la teoria ‘pan-ibèrica’, en Gòmez-Moreno, bé que identificava el paral·lelisme amb aquelles escriptures. I especialment rellevant per el que aquí estem parlant, entre aquests glifs de sons sil·làbics que segons dèiem, la teoria actual vol que s’haguessin generat en una adaptació a Tartessos d’un signari semític consonàntic. Gràficament:

minoic-silab-1

De: Gómez-Moreno, Manuel : 1949 : “La escritura ibérica y su lenguaje” : Misceláneas. Historia, arte, arqueología, (dispersa, emendata, addita, inedita). Primera serie, La Antigüedad : p.257-281

Com es pot veure, casi tots els signes sil·làbics nord-orientals tenen paral·lels (tret dels  de ba, be i do/to) en signes qualificats l’any 1949 per en Gomez-Moreno de ‘minoics’.

No seria més senzilla una hipòtesi combinada? Una influencia ‘semita’ al sud, al segle VII i una altra ‘minoica’ al nord al segle V? No seria pas l’únic cas conegut d’escriptura semisil·làbica apareguda en aquest marc temporal, a Persia, per exemple, tenim al segle VI aC la creació d’una variant del cuneïforme. Les fonts del primer mil·lenni abans de Crist són molt limitades però no són nul·les, i per tant, no es pot ignorar l’aportació de la Història en aquests afers.

No cal multiplicar aquí les especulacions, el que es vol remarcar, es que cal obrir la mirada i tractar tant els temes històrics com els filològics amb el rigor necessari, fugint d’apriorismes i essencialismes. Segur que els amants de Clio cometem innumerables aberracions filològiques, però si no mirem de corregir-nos, mai no millorarem. Aquest és l’esperit darrera aquests comentaris.

Portem l’atreviment un pas més enllà, i encarem l’altra part d’aquest apunt tornant al tema de la variabilitat sígnica de l’ibèric nord-oriental.

Variants de l’ibèric nord-oriental.

En el resum del mes passat, ens preguntàvem com s’ho haurien pogut fer els autors de la proposta de codificació per a Unicode, per dir que havien triat els glifs més habituals per a cada so, per fer la proposta. Els únics corpus publicats amb aquesta informació són el de ibers.cat, i el de cathalaunia, derivat seu, aixi que calia confirmar si potser els autors disposaven d’un corpus similar no publicat. La resposta va ser que encara no, però que s’espera que el projecte Hesperia, incorpori aquesta informació en els anys vinents. Així doncs, l’estimació havia estat feta a partir de dades parcials. Resultava trivial recomptar els glifs en el corpus de cathalaunia, i comparar-ho amb els resultats de la proposta Unicode, i d’això parlarem tot seguit. Però cal primer fer una petita explicació sobre la variabilitat sígnica dels testimonis de l’ibèric nord-oriental.

Tot i que sí tenim alguns exemples d’epigrafia sumptuosa i de qualitat, la gran massa d’exemples epigràfics són marques fetes manualment, sovint de poca qualitat, i que en una mirada inexperta semblen més gargots que no pas lletres. Hi ha doncs una feina feta per els filòlegs i epigrafistes per agrupar tots aquest testimonis en uns conjunts de símbols més o menys coherents. Na Carme Huertas, els simplificava en cent trenta i pocs glifs, Untermann abans ho havia fet en 95. La diferència, a grosso modo s’explica perquè la barrera, la diferenciació, entre un glif i un altre és en part subjectiva; un exemple: un dels signes per la ‘u’ és una fletxa que apunta cap amunt; en alguns casos la barra vertical no arriba a tocar la punta, i donat que hi han altres signes en el quals el detecta quelcom semblant, es fa difícil discernir entre una variació intencionada o una de casual, i per tant, segons la voluntat de l’expert hi veurà un o dos signes.

Sabem que l’escriptura de l’ibèric presenta senyals d’una certa sistematització sígnica; els signes duals afegeixen una barra vertical al signe base. En aquest sentit, un altra senyal que no he trobat reflectida en la literatura és la diferenciació entre tenir o no un traç vertical llarg. El trobem entre molts signes: entre ‘a’s amb forma de P o D, entre ‘i’s i ‘n’s curtes o llarges (de fet les ‘i’s i les ‘n’s sols es diferencien estructuralment en què les primeres afegeixen un traç vertical petit en la  part superior), entre les ‘m’s en forma de V o Y, entre les ‘r’s amb forma de P i D especulars, i també entre glifs de sons diferents: entre ‘r’s i ‘gu’s amb forma de rombe/rodona, i especialment entre els sons ‘to’ i ‘ti’, que es diferencien únicament en tenir o no un traç vertical a sota (i en aquest cas, fins i tot es detectava la mateix distinció en les formes de tres puntes, entreamb  una base horitzontal o una puntual).

En la detecció de co-aparicions de glifs al·lògrafs que es va presentar en aquest bloc, es postulava una forquilla entre 85 i 96 glifs diferents. Veient que eren unes xifres properes a la de Untermann però molt diferents de la dels experts, es va demanar el seu parer, per si s’estava cometent algun error sistèmic que permetés explicar tal discrepància. Les respostes, que no puc sinó agraîr públicament, van ser variades, però la més interessant i detallada es podia resumir en una paraula: incredulitat.

Els filòlegs han re-construit penosament el so de l’escriptura ibèrica, el desxiframent que dèiem, i basen sobre aquest esquema sonor (sil·làbics dobles+consonants+vocals dobles[11]), la seva representació amb un únic glif per so. El problema com hem anat repetint, creiem que rau en què no han estat sistemàticament exposats a la variabilitat sígnica en tot aquest procés de desxiframent, i ara, el concepte que aquests 49 sons puguin tenir una representació amb un centenar de glifs, els resulta estrany, potser difícil de conceptualitzar[12]. Des de aquesta posició, és fàcil entendre els possibles errors sistèmics al recompte de co-aparicions que van enumerar. Els comentem un a un.

  1. En primer lloc, el fet que el corpus és el resultat de molts segles d’escriptura, i que per tant, no es podia analitzar conjuntament. La resposta és fàcil. Encara que és evident que les epigrafies s’estenen en un període de segles, les co-aparicions en un mateix text són per definició simultànies. Com a molt, es podria plantejar la creació d’un mapa cronològic de co-variants d’un glif, i cercar patrons d’ús (una tasca no pas fàcil, atesa la pobre fiabilitat de les datacions i localitzacions de moltes de les peces).
  2. La segona estaria en part lligada amb la primera, i vindria a dir que encara que és cert que si trobem A+A’ juntes, això indica que són signes diferents, si a part trobem A+ A”, això no indica que A” tingui que ser un tercer signe (podria ser una A’ que ha mutat de forma, per exemple). El problema amb aquest argument, és metodològic. Si dic que A+A’ indica diferència, a sant de què puc ara dir que A+A” no ho fa? En altres paraules, viola la llei de l’explicació més simple. Es buida de valor? Tampoc, però caldria donar una raó a una tal violació del mètode en cada cas per poder-la acceptar, i en això tornaríem al mapa cronològic de co-aparicions que dèiem abans com a pas previ per poder plantejar la possibilitat que el signe A’ hagués mutat en el signe A” en un moment i context determinat. Sense això, si trobem A+A’ i A+A”, el més lògic és pensar que estem davant de tres signes: A, A’ i A”.
  3. El tercer ja era més tautològic. Els corpus tenia molts errors i per això es detectaven co-aparicions on no hi són. Afirmació que seria de gran valor si el que l’emet l’acompanyés del corpus ‘correcte’ i la seva comparativa corresponent. A falta de les proves, en ciència, evidentment no es pot tenir en consideració de cap mena de manera una tal afirmació. I és que sembla talment que l’evidència presentada no ha estat convenientment considerada. En un total aproximat de 3.000 epigrafies i – com veurem tot seguit – 24.000 símbols, es detectem a prop d’un miler de co-aparicions repartides en 381 epigrafies, amb desenes d’elles, presentant-ne no una ni dues, sinó entre cinc i quinze (només s’ha de repassar l’apèndix A de l’article)! Gràficament:
    geu-7

    Nombre de co-aparicions vs. nombre d’epigrafies.

    La probabilitat que una distribució tal es pugui deure a errors de transcripció més o menys aleatoris és ínfima, residual
    Altra cosa és que el tema de la correcció del corpus és certament de màxima importància. El gruix del contingut actual és hereu del corpus de ibers.cat com dèiem, i l’única manera d’evidenciar la seva correcció, crec que passa per incorporar en el màxim nombre d’entrades (a ser possible, totes) l’esquema o dibuix de les epigrafies originals (les fotos sovint resulten menys entenedores que els dibuixos). A tal fi, s’ha posat en marxa la recollida i preparació d’aquests nous continguts. De fet, crec que l’establiment d’un corpus reconegut entre els especialistes que contempli les variants hauria de ser un pas previ imprescindible en l’estudi de l’escriptura ibèrica. Que consti que la predisposició en aquest sentit és absolutament oberta per part de cathalaunia.

Tenint en compte aquestes consideracions doncs, per el moment, res obliga a replantejar sistèmicament el treball de detecció de co-aparicions[13] fet.  Potser els filòlegs tenen dificultats per explicar la pluralitat de glifs emprat conjuntament per un suposat mateix só, però això en cap cas hauria de dur a negar l’evidència i fer veure que no hi és. Sembla evident que actualment manca una explicació raonable per explicar la variabilitat sígnica de l’ibèric nord-oriental (una raó de fons, que sembla de pes, per apel·lar a la prudència abans de donar per bones les codificacions actuals per a Unicode).

Un cop vist el tema de la varietat formal de l’ibèric, passem al seu recompte, i en certa manera, a anar a l’inrevés, a agrupar més i més els signes.

Recomptes i comparacions

El corpus de cathalaunia en el moment de fer aquest apunt presenta 3.246 entrades (un mateix objecte pot tenir vàries entrades, com per exemple, un plom amb dues cares escrites) que conformen un conjunt d’uns 30.000 signes, format per un signari de 134 símbols. Total, que es redueix a 24.048 signes si ignorem espais, puntuacions i altres marques i es fixem només en els fonètics (terrible pensar que tot el que queda d’una escriptura que vam emprar durant mig mil·lenni és com a molt una dotzena de pàgines escrites!). Presentem gràficament les freqüències de cada glif:

codes-sort

Les freqüències del corpus ibèric de cathalaunia amb 3.246 entrades.

Els dos primers signes, els més freqüents, necessiten d’una mínima explicació. El primer, el de forma de quadrat, indica en la codificació de cathalaunia un glif il·legible i també codifica una discontinuïtat en el suport, per això és tant freqüent. El segon, una barra vertical, que sí és un signe ibèric, té un surplus d’aparicions ja que s’emprava numèricament per indicar unitats; un recompte aproximat en detecta uns 300 en aquesta modalitat, de forma que podem recomptar-ne aproximadament uns 1.200 en ús fonètic.

Si els promotors de la proposta Unicode haguessin triat les variants més freqüents, les hauríem de poder localitzar en la part alta del gràfic, però no és completament aixi, les marcarem en blau:

codes-sort-unicode

Els glifs de la proposta per a Unicode per el signari dual, marcats en blau.

Gràfic que també requereix d’algun comentari. En primer lloc, hi han signes que són poc freqüents, i que per tant no poden estar en cap cas en la part alta de la taula. En segon, cert és que en la proposta per a Unicode es marquen altres variants (per el signari no dual[14]) que cobreixen algunes de les manques principals, però el problema està en que no tenen codis diferenciats, i per tant no els podem marcar conjuntament amb els del dual en aquest recull. És exactament això el que volem posar de manifest, que la reducció a 49 signes és excessivament dràstica. Sense ser un expert en cap cas, sí que puc dir que després de la feina feta en el corpus del web aquests darrers anys, em resulta inimaginable reproduir les epigrafies ibèriques sense glifs tan bàsics, com el de forma de V per les ‘m’s, el que sembla una S per ‘s’s, el rombe per ‘r’s o el que sembla una R per certes ‘a’s.

Però com que els glifs s’agrupen per sons, podem veure’n també les seves freqüències (per simplificar ho fem emprant les agrupacions del signari simplificat de cathalaunia, que no diferencia entre els sil·làbics forts o febles i que agrupa les vocals en els cinc sons habituals).

simpfreqlist

Les freqüències dels sons segons les agrupacions del signari simplificat de cathalaunia.
I la reducció posterior a 5 vocals i 7 consonants.

I en la part dreta, tenim el recompte, reduint el conjunt a només dotze categories bàsiques (5 vocals i 7 consonants), com si haguéssim repassat les transcripcions a lletres llatines que usualment es fan i agrupéssim convenientment les consonants i vocals. Aquest total lògicament varia ja que els sil·làbics es compten dues vegades (per la vocal i la consonant que els formen).

  • A       4.893
  • I        3.995
  • E       3.317
  • D/T  2.985
  • C/G  2.790
  • R       2.565
  • S        2.393
  • N/M  2.311
  • B        2.184
  • U        1.701
  • O        1.466
  • L        1.339

Una distribució que certament necessitaria d’un filòleg per comentar-la. Peró arribats en aquest punt, va semblar que seria relativament fàcil comparar aquestes freqüències amb altres idiomes moderns, de manera que així s”ha fet, i el que començà com un divertimento, acabà sent inesperadament revelador…

El que es va fer va ser: agafar un mateix text (els primers cinc capítols del Gènesi) traduït en quatre idiomes diversos: català, castellà, euskera i llatí, i compara-ne les freqüències d’aquests mateixos 12 sons/lletres bàsics de cada una de les llengües amb la del corpus ibèric. Podem visualitzar la distribució de cada idioma en una gràfica, on a cada columna tenim una lletra que mesuri el percentatge que ocupa en el seu corpus (els text bíblic per aquests idiomes, i el corpus d’inscripcions en el cas de l’ibèric). Com que l’escriptura ibèrica nord-oriental és la base que estem estudiant, les columnes de la llista anterior, segueixen el seu ordenament de major (esquerra) a menor (dreta). El resultat dels cinc idiomes és:

geu-1

Les freqüències aproximades dels cinc idiomes.
L’eix vertical és el percentatge de cada lletra en el seu corpus,

I per visualitzar millor les diferències de cada lletra de cada idioma amb l’ibèric podem mostrar sols les diferències entre els percentatges (les columnes de l’ibèric estan lògicament a 0).

geu-2

Els percentatges de diferència de cada lletra de cada idioma respecte l’ibèric.
Valors positius indiquen escreix en ibèric.

I ja posats a fer, podem mesurar el grau de semblança entre aquestes distribucions. Una de les maneres més simples de comparar dos vectors, és amb l’error quadràtic mig. Que aplicat al nostre exemple, vol dir: per a cada idioma  i cada lletra, comparem la seva barra amb la barra de la lletra de la mateixa lletra en ibèric (el gràfic anterior), convertim aquesta diferència en un quadrat i en calculem la mitja de totes les lletres de l’idioma. El resultat, ordenant les llengües de més semblants (esquerra) a més diferents (dreta) a l’ibèric, és:

geu-6

Error quadràtic mig.

O el que ve a ser el mateix, si es prefereix, podem convertir aquest error quadràtic en lineal, fent-li l’arrel quadrada i així tenir una ‘diferencia percentual mitja‘ de cada llengua vs. l’ibèric:

geu-8

Error percentual mig.

Les semblances amb l’euskera (ben documentades en la literatura sobre l’escriptura de l’ibèric nord-oriental), semblen doncs existir també a nivell de freqüència d’utilització de les lletres en la seva escriptura. De mitjana te una diferència de poc més d’un 1.5% respecte l’ibèric, mentre que el català i el castellà, es situen entre el 2,5% i el 3%, amb una lleugera avantatja per el català, però el que sembla més curiós, és que la l’altra llengua antiga en aquesta comparativa, el llatí, es mostra força més allunyat de l’ibèric que els seus presumptes descendents peninsulars.

Però podem anar més enllà i emprar un estimador de correlació més complert, que tingui en compte també la covariànçia de les dades (si la seva dispersió també és similar), com per exemple el coeficient de correlació de Pearson, i tindrem:

geu-3

Correlació de Pearson entre els % de cada lletra de cada idioma respecte les de l’ibèric.
1 = correlació perfecte, 0 = no correlació, -1 = correlació inversa perfecta.

I veurem que l’euskera arriba quasi bé al 0.9, seguit (a distància) per el català amb poc més d’un 0.6 i amb un castellà en la zona del 0.5 i el llatí per sota d’aquesta marca. Uns resultats clarament contraris a una distribució aleatòria en el cas de l’eusquera.

Certament és un experiment simple, una comparativa com cal hauria de basar-se possiblement en la distribució acurada dels sons de cada llengua i a partir de conjunts de dades més amplis. Però atès que en el cas de l’ibèric la relació glif-so es encara poc definida, i la mida del conjunt de dades disponible desafortunadament molt limitada, potser sí tingui la seva part de lògica el comparar, ni que sigui matusserament, les seves transcripcions.

Per això parlàvem inicialment de demostrar estadísticament la proximitat entre l’ibèric nord-oriental i l’euskera. Arribats aquí, no sembla pas impensable que en un atac estadístic, la comparació de l’ibèric nord-oriental amb l’euskera (fins i tot l’actual) pogués ajudar a definir components del primer, i potser així ajudar a entendre’n l’estructura aglutinant de la seva llengua.

Crec que només caldria finançament per fer la prova, les dades, les tenim…

Coda

A semblança del que va passar amb l’apunt sobre els caràcters de l’ibèric nord-oriental, la part final d’aquest apunt ha acabat produint un nou article: Vilaseca i Corbera, Joan : 2016 : “Una comparació entre l’ibèric nord-oriental, l’eusquera, el català, el castellà i el llatí”. Qui així ho vulgui, allà hi trobarà les dades i els detalls dels càlculs aquí comentats.

– Actualització 2016-XI-16 –

Els dos darrers paràgrafs abans de la Coda han estats reconsiderats a: Bascoiberisme circular?


Notes

Publicat dins de Adolf Schulten, alfabets semisil·làbics, bascs, Carme J Huertas, Castella, català, cathalaunia.org, Celtas, celtibèric, co-aparicions, codificació, coeficient de Pearson, correlació ibèric nord-oriental - euskera, covariància, cuneiforme, David Folch, Egeu, epigrafia ibèrica, error quadràtic mig, Espanca, estadística, euskera, eusquera, Garona, Gàl·lies, grup LITTERA, Hesperia, Hiberos, Hiberus, Hispania, Ibèria, ibèric nord-oriental, ibèric sud-oriental, Iberika, ibers.cat, Jürgen Untermann, Jesús Javier Velaza Frias, Joan Ferrer i Jané, Joan Vilaseca Corbera, llatí, Manuel Gómez-Moreno, Manuel Medrano Marqués, Minoics, Noemí Moncunill, Persas, Persia, Phoenicas, Pirineus, Poenos, Serafín Olcoz Yanguas, signari tartessi, Tarragona, tartessi, UB, Uncategorized, Unicode, Vall d'Aran, variants, Varró | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | Deixa un comentari

2016-octubre a cathalaunia.org

Inesperadament, octubre ha estat un mes ibèric. També el més passat havia tingut una forta activitat en aquesta temàtica, però la previsió inicial era concentrar-se en el Fons Cathalaunia i l’alta edat mitjana (la proximitat de la marca dels 1.000 documents, encara que sigui una fotesa, fa il·lusió). Amb tot, tot just encetat el mes, una idea va fer irrupció i a partir d’ella se n’ha anat tota l’activitat del mes. El resultat és més que interessant, així que no ens queixarem pas, però és ben cert que no estava pas previst.

La idea va ser molt simple: atès que el corpus d’epigrafia ibèrica de cathalaunia està fet codificant informàticament els signes originals de l’escriptura, i no a base de translacions fonètiques amb lletres llatines com acostumen a emprar els filòlegs, es podia analitzar la presència conjunta de més d’una variant d’un mateix so (dues ‘a’s, o dues ‘l’s, escrites amb glifs diferents) en una mateixa inscripció, sota el principi que si això es detectava de forma no espúria, podia indicar intencionalitat per part de l’autor original (com nosaltres bé diferenciem entre majúscules i minúscules o entre posar o no accents), i per tant, ser una informació a tenir present.

Hom podrà pensar que una consideració tan bàsica, ja hauria estat atesa fa molt de temps, però la realitat és que no. La dificultat de treballar amb els signes originals (i entre les escriptures preromanes, s’han detectats més de dos cents glifs diferents) i la necessitat de mirar d’escatir com sonava (el que els filòlegs entenen per ‘desxifrar’) van fer que la transliteració sigui la norma, i que l’aspecte original d’una inscripció fos un tema, si bé inevitable, en tant que en ser de factura autògrafa la seva lectura és sovint dubtosa, no per això, integrat en l’estudi integral de la llengua. Interessava saber si hi havia un ‘ti’ o un ‘to’, la forma en que estigués escrit no era (lògicament) una informació especialment rellevant.

Excepte quan s’ha arribat a plantejar l’establiment d’un signari unificat, llavors és quan el tema dels glifs i el de la seva variabilitat ha passat a ser indefugible, i la solució més recentment proposada (en la codificació de l’escriptura ibèrica per l’estàndard Unicode), ha estat dràsticament reduccionista. Dels més de cent-trenta glifs diferenciables emprats en la codificació de cathalaunia (seguint essencialment la proposta de na Carme Huertas), o dels 95 llistats per Untermann, hem passat a 49, amb un únic glif per so. Segons això, tot el corpus ibèric es pot resumir en cadenes d’aquests 49 signes. Ara, era això així per els autors? La contradicció entre una llengua amb 49 sons, però amb un centenar de glifs per representar-els, sembla evident. I el que resulta simptomàtic, preguntats els experts per tal incongruència, no hi ha una resposta clara. El tema sovint s’obvia, la mateixa proposta per Unicode es limita simplement a dir que existeixen variants i que s’han triat les formes més representatives per a cada un dels sons  (una consideració de passada: com poden saber quin glif, quina forma és la més freqüent, si els únics corpus globals existents amb tal informació són, el creat per la Carme Huertas i en David Folch i el derivat del seu de cathalaunia…!?).

Així que tenim una manera de verificar si efectivament només ‘s’emprava un únic glif per so en un moment donat, ja que si fos així, mai, (o molt rarament) trobaríem dues variants d’un mateix so en un mateix escrit (excloent els casos de glifs amb formes molt properes, i per tant explicables a partir de la variabilitat natural d’una escriptura autògrafa). Informàticament resulta trivial detectar quins signes apareixen amb quins altres, de manera que tenint el corpus, les capacitats tècniques i la idea, no es podia deixar passar l’oportunitat. El que no s’esperava era que arrastrés la feina de tot un més a partir de les seves conseqüències.

Aquest bloc, ha tingut un entrada on es detallen els resultats d’aquesta recerca (purament quantitativa), i queda encara un apunt més per fer sobre aquest tema, de manera que avui ho deixarem aquí.

Però l’àrea ibèrica de cathalaunia, ha tingut també un seguit de millores durant aquest mes.

  1. S’ha corregit un petit error que feia que en certes ocasions (epigrafies d’una única lletra) en els resultats de les cerques, en comptes de mostrar-les ressaltades, no apareguessin.
  2. Si un mateix text original existeix en més d’una versió en el corpus (relectures fetes per diversos autors) s’han afegit les referències a questes altres versions (amb la notació ‘idems’, en cada una d’elles, a semblança del que ja es feia per altres redundàncies en el Fons Cathalaunia). Actualment hi han una seixantena d’epigrafies ‘redundants’[1].
  3. Les eines de cerca simplificada s’han vist reforçades, amb un seguit d’agrupacions de signes predefinides noves (coses com: vocals, consonants, sil·làbics, etc). Això no és estrictament una novetat, és sols una facilitat (emprant els ‘[”]’ ja es podien fer les mateixes cerques) és sols que ara, són més fàcils de fer. Però també s’ha afegit un operador lògic nou ‘&’, i això sí es una millora estructural. Fins ara, una cerca buscava epigrafies que complissin una única condició (per exemple, que presentin una ‘a’ seguida d’un ‘ki’), amb aquest nou operador podem afegir condicions extres (en l’exemple anterior, que a més, tinguin una ‘o’ seguida d’un ‘ba’). És una primera versió, encara està en proves i hi han coses a polir, però tot el que sigui ampliar les capacitats de consulta és més que benvingut.
  4. I per si fos poc, s’han afegit un grapat d’epigrafies noves.

Però el mes havia començat amb un parell d’esdeveniments acadèmics que ja havien estat anunciats en aquest bloc. Esdeveniments als que es va poder assistir, i que, tot i que no han generat un apunt propi per manca de la necessària adequació, si poden ser col·loquialment consignats en aquest resum mensual. Començant per el darrer…

El dia 5 del mes tingué lloc en la sala Nicolau Olwer de l’IEC, la conferència: L’auge dels Cartellà al segle XIII: política i genealogia, de la mà de na Mercé Homs i d’en Stefano Cingolani. Havent tingut notícies prèvies de la cuina del projecte, no va ser cap sorpresa el grau d’erudició, documentació i detall del treball presentat. Sempre sembla un luxe rar per els qui estem estudiant èpoques menys ben documentades, el poder disposar de centenars de documents sobre la matèria a investigar. No així en l’edat mitjana, on el repte sovint és saber organitzar i presentar la massa documental disponible. Entenc que en aquest sentit, el treball presentat en l’ocasió mostrarà en la seva edició sobre paper un més que ben servit aparell documental. El nivell d’excel·lència de la producció prèvia d’en Cingolani en aquesta mena de reptes, aportarà sens dubte la contrapart complementària a la exhaustiva reconstrucció genealògica realitzada per Homs.

A tall personal. Sempre té quelcom de captivador sentir les disquisicions de qui s’ha dedicat a reconstruir vides i famílies llongament passades. És un punt on la vivència de la Història s’acosta a l’Art; i on el contrapunt d’una documentació rigorosa forneix el complement per fer-ne de tot plegat un digne fruit de l’amor al saber.

Un parell de dies abans, en la Sala Pi i Sunyer del mateix IEC, s’havia celebrat una Jornada de títol: Catalunya i les noves tendències en cartografia històrica. Esdeveniment que reuní set ponències que donaren un tast molt ben equilibrat de la temàtica enunciada.

No sent cartògraf, disculpeu que no entri en els detalls de les ponències, – no podria fer més que mostrar ignorància -, però sí aportar un comentari com a professional del món de la computació i estudiant de les labors de Clio; però primer, llistem les ponències.

  1. Obrí la sessió, en Josep Guitar (UAB,ICAC,IEC): Cent anys de cartografia del món romà: el programa TIR-FOR.
  2. Rafael Roset (ICGC): La digitalització de mapes antics.
  3. Jordi Bolós i Masclans i Víctor Hurtado (UdL): Els atles dels comtats de Catalunya i la digitalització de la cartografia històrica.
  4. Marta Prevosti i Núria Romaní (ICAC): Una nova metodologia per a la cartografia del món romà.
  5. Ada Cortés i Pau de Soto (IEC,ICAC): Panorama de la cartografia del món antic on line.
  6. Johan Åhlfeldt (Lund University): The Digital Atlas of Roman Empire.
  7. Leif Isaksen (Lancaster University: Mapping the Ancient World in a Digital Age.

Abans d’entrar en el nucli del tema que sí vaig trobar sorprenent de la jornada, no puc deixar de comentar que en la ponència d’en Bolós i Hurtado, es va anunciar que l’any que ve apareixeria el darrer volum dels ‘Atles del comtats de Catalunya‘. Es completa així una feinada de trenta anys! Només puc afegir des d’aquí el desig que, tant de bo pugui trobar el seu reflex digital.

Ara, anant al tema espinal de la jornada: la digitalització i la cartografia històrica.

Va ser una jornada on es va poder evidenciar les dues menes d’iniciatives actualment existents en la intersecció entre el mon del coneixement i el de la difusió digital d’informació. En un primer nivell tenim les iniciatives que generen les dades, on els experts van aportant i construint el coneixement que es mostra al públic (biblioteques, diccionaris, enciclopèdies, bases de dades, webs, instituts, etc, etc) i en un segon nivell, les iniciatives que a partir de les dades que proporcionen els primers, procura crear un valor afegit agrupant-les i presentant-les de manera adient. Simplificant, col·loquialment: productors i recol·lectors.

El conjunt funciona gràcies a que en el primer nivell, els productors, segueixen generalment la recomanació dels experts en comunicació i per a cada ítem que volen exposar al públic faciliten una adreça electrònica estable (URI, en la terminologia del sector). Així, per exemple, cada biblioteca assigna a cada una de les seves entrades bibliogràfiques una adreça d’accés públic única i fixa. El mateix, per a qualsevol altra mena d’iniciativa, siguin llibres d’una biblioteca, topònims d’una base de dades geogràfica, o entrades d’una enciclopèdia (a cathalaunia.org, per exemple, cada document altmedieval, cada epigrafia ibèrica, cada antropònim, etc, té una adreça única i estable al llarg dels temps). Això permet que un actor extern, humà o mecànic, pugui enllaçar de manera fiable amb els continguts presentats.

Bé, aquest primer nivell, és  doncs on es genera el coneixement i on treballen els experts en cada un del camps corresponents a cada una de les iniciatives. Un nivell format per milers de webs i institucions, cada una experta en el seu camp.

El segon nivell, és més eteri, i per copsar-lo cal com cal cal entendre que en la informació digital, els éssers humans no som el principal consumidor, ho són les màquines, els programes.

La majoria de les comunicacions entre ordenadors estan originades per programes, no per persones. La gent som els creadors i com a molt l’usuari i controlador final, però un programa pot fer en dècimes de segon el que a una persona li prendria tot un dia, i per tant, en realitat, el gruix dels intercanvis entre ordenadors estan originats per programes. Tant si tenen un objectiu més o menys decent, com per exemple recollir i analitzar la informació per facilitar-ne el seu accés (cercadors), com per altres usos més tèrbols. De manera que cada una d’aquelles adreces web estables (URIs) que els productors de coneixement van creant i assignant a les dades, en realitat és emprada bàsicament per màquines, per programes que van recollint la informació. I és que la informació es compra i es ven, res és innocent en aquest món.

En el segon nivell, dèiem que tenim les iniciatives que viuen de les dades presentades per els productors del primer nivell, de manera que a efectes pràctics estan al mateix nivell que els programes i empreses que es dediquen a col·leccionar/mercadejar amb les dades. Cert que no tenen perquè ser el mateix, però cert també que tampoc es poden diferenciar operativament. La idea, és que en el millor del casos, algunes iniciatives intenten aprofitar les sinergies derivades del creuament de dades de varis productors del primer nivell per afegir un valor nou, no present en cada un dels productors per separat. Però a diferència dels del primer nivell, que resulten relativament fàcils de qualificar (és bona la informació que presenten? és completa? verificable? etc, etc), aquest valor afegit, emanat d’una agrupació i organització/presentació de les dades del primer nivell, és mes difús i de mal avaluar. Hi ha de tot, des de projectes amb molt de sentit a autèntics venedors de fum. I aquí tinc que tornar a la jornada.

Entre els primer ponents tindríem exemples d’iniciatives del primer nivell, productors nets de coneixement. El sisè, en Johan Åhlfeldt, el del projecte DARE, seria un exemple dels de segon nivell (a cathalunia.org ja fa anys que en les adreces d’interès hi figura un altre dels seus projectes: el Regnum Francorum Online). Un intent d’aprofitar la connectivitat i les dades d’una pluralitat de productors per fornir una versió digital del projecte TIR-FOR on poder consultar en línia les dades disponibles de cada assentament conegut de l’imperi romà. Un projecte encomiable, però com tots els ‘recol·lectors’, a priori,  de mal avaluar o verificar.

La setena ponència, però, mereix un esment a part ja que en Leif Isaksen representava al projecte Pelagios, una variant diferent d’aquest mateix segon nivell, i aquí, com a professional del món de la computació hi tinc força més a dir.

Hem dit que les iniciatives de segon nivell recollien informació, ara, és ben evident que no és el mateix recollir/organitzar informació històrica, que sobre biologia, o sobre calçat, si voleu. Cada àmbit del coneixement defineix una pluralitat de maneres possibles d’organització, de manera que les iniciatives de segon nivell, utilitzen, cada una d’elles, les convencions per agrupar i presentar la informació que els hi semblen més adients. Dit d’altra manera, generen un nivell d’abstracció superior al dels productors. El problema amb els nivells d’abstracció (i els professionals de la computació en som especialment conscients) és que res impedeix que siguin també abstrets al seu torn, de manera que podem anar construint jerarquies ontològiques per organitzar la informació amb una certa facilitat i/o arbitrarietat. En els productors, aquest problema també hi és, però està força acotat, tota vegada que cada disciplina defineix les seves formes d’organització bàsiques; no així entre els recol·lectors, on no hi ha cap norma o criteri fiable a seguir. Tots els intents coneguts de sistematització ontològica (i la informàtica n’ha esperonat uns quants) s’han enfonsat davant la natura eclèctica del coneixement humà.

El projecte Pelagios està entre els que malden per crear estàndards d’intercomunicació de projectes sobre coneixements històrics, especialment entre nomenclàtors digitals (gazetteers en la moda del sector, com per exemple el projecte parent Plèiades). La idea és basa en mirar d’utilitzar/compartir/promoure una ontologia/conjunt d’ontologies descriptives d’aquesta mena d’informació. El problema és doble: tècnic i pràctic.

En la part tècnica, volen emprar els principis del Web Semàntic, un dels blufs informàtics més repetits aquests darrers anys, ja que per una banda necessita sí o sí que la gent (els productors, i especialment els  recol·lectors) facin servir les seves facilitats i anotin la informació d’una certa manera (les ontologies que dèiem), i per l’altra, confia infundadament en les suposades bondats del tractament informàtic del llenguatge, quelcom que la pràctica ha anat desmentin reiteradament. I en la part pràctica, tenim que en dependre essencialment del grau d’utilització dels productors i/o recol·lectors de les seves utilitats/convencions, adopten estratègies de màrqueting per mirar d’implantar-se; quelcom que sembla antitètic amb la filosofia dels productors, que a priori sols procuren atendre al Coneixement. Hom trobarà en les pàgines dels llocs web d’aquesta mena d’iniciatives desenes d’invitacions a ‘unir-se a la causa’, però poca o cap descripció de ‘la causa’, una casuística recurrent en els models de màrqueting expansius. Recorda aquells intents basats en el: ‘si tothom fes les coses així…’, on usualment hi ha algú que controla el ‘com’ i que en el fons aspiren a fer-se ‘too big to fail’. Entenguis, no és que no pugui tenir beneficis per a la comunitat en general, en teoria, (i el basar-se en estàndards oberts és una decisió absolutament correcta),  és que la pràctica recomana no posar massa ous en un mateix cistell[2].

Aquí hi ha un perill real, ja que l’experiència ensenya -durament- que apostar per projectes amb una base teòrica feble[3], fa perdre molt de temps i esforços mirant de fer girar una roda que per començar no era rodona. Pot semblar un comentari dur, però neix de l’experiència acumulada en dècades de programació en la IA. Suposo que és un punt de vista contrari a una part dels ponents (alguns d’ells relacionats directa o indirectament amb el projecte Pelagios), però he vist massa vegades esforços dedicats a intents de codificació (per descomptat,  fets amb la millor de les intencions), que han acabat a la paperera, a voltes per no ser pràctics, a voltes per la desaparició d’alguns dels participants claus, a voltes per simples interessos econòmics, o simplement per fer-se vells. Si una iniciativa així pot servir per recollir subvencions i fer bullir l’olla un temps, fantàstic; si incrementa la visibilitat d’alguns dels productors, millor encara; però els grans plans d’un futur millor via integració de la informació són, ara per ara, fum. El futur de la codificació i manipulació de la informació està encara massa obert. De fet, ho està tant, que no tenim ni idea de per on evolucionarà.

Tornant finalment a la visió general. Els productors generen un coneixement efectiu, alguns recol·lectors com els d’en Åhlfeldt, poden també generar-ne en la mesura que complexin els estàndards de rigor i verificabilitat dels productors base que utilitzen, però nivells superiors d’abstracció, d’organització de la informació, tenen el perill real de ser més bones intencions que no pas ajudes efectives, ja que la teoria i la pràctica, ensenyen que el consens es difumina quan el camp examinat, el domini del coneixement, s’amplia -i en aquest bloc ja vàrem comentar fa un temps la problemàtica d’un cas força més concret i per tant força menys problemàtic-. Com s’ha dit abans: tots els intents de sistematització/mecanització ontològica del coneixement humà han fracassat fins el dia d’avui[4].

Resumint, vaig sortir de la jornada amb una sensació agredolça. Que la gent que treballa amb nomenclàtors sigui conscient dels beneficis potencials de la difusió digital és una excel·lent notícia, ara, que puguin abraçar-la satisfactòriament sense recórrer al consell dels experts en computació (i aquesta és la sensació que un sovint té), és fals. Les monedes sempre tenen dues cares.

La Bibliografia del mes també ha estat marcada per la llengua i l’escriptura ibèrica. Un allau de lectures ha fet desbordar la llista de ‘perllegir’s, i en tractar-se d’una temàtica no troncal, s’ha preferit atacar-la frontalment i llegir i processar-ho tot, per tal de no deixar un pòsit potent de lectures pendents no estrictament històriques. La majoria d’aportacions són treballs excel·lents, però també hi ha alguna astracanada, tot sigui dit.

Però per el que fa a l’alta edat mitjana, aquest mes també hi han hagut un parell de notícies bibliogràfiques inesperades, aquest cop en la Gallica de la BNF. Per una banda un parell de cartularis de la zona Tolosana, que si bé afecten poc al treball en el Fons Cathalaunia (actualment processant els documents anteriors al 915), sí aporten informació rellevant un cop ben entrat el segle X, es tracta de: Durban, Cau : 1896 : “Abbaye du Mas d’Azil. Monographie et cartulaire 817 – 1774. I especialment, de: Ourliac, Paul + Magnou, Anne-Marie : 1984 : “Cartulaire de l’abbaye de Lézat”, cartulari aquest que si ja en la ressenya del primer volum es féu notar la manca d’índexs, promesos per el segon, l’edició final d’aquest, obvià presentar-ne per a la cronologia. Manca inexplicable, després de la feinada dels editors.

De manera que per a qui li sigui convenient, aprofitem aquest apunt per proporcionar dos PDFs amb els índexs cronològics del cartulari de Lézat. Un ordenat per document, i l‘altra per data.

L’altra sorpresa va ser constatar que els volums de: Magnou-Nortier, Elisabeth + Magnou, Anne-Marie : 1996 : “Recueil des chartes de l’abbaye de la Grasse”, ara es troben disponibles en format PDF (seguint l’enllaç, els trobareu). Potser ja fa temps que hi són, però aquí, certament ha estat una novetat; les fotocòpies sobre la taula ho proven fefaentment.

Finalment, seguint el costum, llistem les incorporacions del mes per seccions[5]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.559 pàgines consultables.


Notes

  • [1] Es poden llistar especificant en la cerca global del web (a dalt a la dreta de la finestra): “Iberika/ idem”. Actualment llista 121 epigrafies, on la immensa majoria corresponen a texts existents en dues versions alternatives.
  • [2] Tot i que en la presentació del projecte es descriu com una iniciativa descentralitzada, el fet, és que els programes que vulguin emprar les seves facilitats programàtiques (la seva API), acaben enviant peticions a pelagios.org. La pregunta és inevitable: i si falla pelagios.org?
  • [3] La debilitat estructural del Web Semàntic rau en una indemostrada confiança en la capacitat de processar mecànicament el coneixement i la parla humana. L’estat actual, és que les dues úniques vies d’aproximació efectiva a aquesta problemàtica tenen dificultats estructurals sèries. Les xarxes recurrents, per falta d’una modelització matemàtica estable, i l’aproximació estadística (simulació a gran escala) per comportar un cost computacional prohibitiu i un abast sempre limitat a domini.
  • [4] Per exemple, no vull ni pensar en el desgavell que poden causar en aquesta mena d’agregadors de dades semi-automatitzats els programes fets amb mala intenció. I la trista realitat, és que el dubte no és is passarà o no, és quan.
  • [5] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.
Publicat dins de Ada Cortés, Atles del comtats de Catalunya, Carme J Huertas, Cartellà, cartografia històrica, Cartulaire de l'abbaye de Lézat, cathalaunia.org, DARE, David Folch, epigrafia ibèrica, Fons Cathalaunia, Gallica, genealogia, IA, Iberika, IEC, Jürgen Untermann, Johan Åhlfeldt, Jordi Bolòs i Masclans, Josep Guitar, La Grassa, Leif Isaksen, Marta Prevosti, Mas d'Azil, Mercé Homs, Núria Romaní, Pau De Soto, Pelagios, pelagios.org, Pleiades, Rafael Roset, Recueil de chartes de l'abbaye de la Grasse, Regnum Francorum Online, Stefano Maria Cingolani, TIR-FOR, Tolosa, Uncategorized, URI, Víctor Hurtado, Web Semàntic | Etiquetat com a , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , | Deixa un comentari

Els caràcters de l’ibèric nord-oriental.

Ara fa poc més d’un any comentàvem en aquest bloc una proposta de codificació Unicode per a l’ibèric nord-oriental (el de casa nostra): Ferrer i Jané, Joan + Moncunill, Noemi + Velaza, Javier : 2014 : “Preliminary proposal to encode the north-eastern Iberian script for the UNICODE standard”. Ja llavors es feia notar que la reducció del nombre de caràcters amb valor fonètic a 49 símbols (code-points en la terminologia Unicode), reduïa excessivament l’expressivitat de la proposta i feia inviable la reproducció fidel dels originals (per els qual s’han registrat més d’un centenar de glifs diferents[1]). El motiu per a tal reducció era doble: per una banda Unicode no permet registrar variants, i per l’altra, amb aquests 49 símbols/sons es suposava poder donar raó de tota l’escriptura. Dit altrament, la resta de glifs (gairebé un centenar, segons les diferents propostes) no serien sinó variacions formals d’algun d’aquests 49 bàsics. Una xifra força semblant, per exemple, a la del llatí antic.

La pregunta és molt simple: és això així?

I la raó del dubte neix en comprovar que els experts filòlegs que han arribat a aquests 49 sons bàsics, ho han fet a partir de treballar majoritàriament amb una representació de les epigrafies transliterada a signes llatins (i que implícitament estava agrupant les suposades variants d’un mateix caràcter o lletra). Atès que el corpus emprat en el recull epigràfic de cathalaunia.org (que és derivat del corpus recopilat per na Carme Huertas i en David Folch, públicament accessible en el seu web ibers.cat) codifica les inscripcions no en una cinquantena de símbols (als 49 cal sumar separadors i uns pocs signes metrològics), sinó en 138 (seguint de prop la proposta de: Huertas, Carme J. : 2009 : “Codificació informàtica del signari-ibèric nord-oriental”), podem mirar de comprovar si efectivament, amb aquests 49 símbols base podem agrupar coherentment les variants fins arribar als 138 signes. Ho mirarem emprant el signari disponible a cathalaunia.org.

El punt de partida és doble, per una banda tenim el signari simplificat emprat a cathalaunia.org, que ja presenta una agrupació de símbols ‘variants’:

si-1

Signari simplificat emprat a cathalaunia.org.

I per l’altra, la proposta de codificació Unicode:

si-2

Proposta de codificació del Signari dual (el més complex).

El signari simplificat que es presenta i utilitza a cathalaunia.org no té un valor filològic. Neix de la necessitat de disposar d’una facilitat que permeti treballar amb el corpus, per exemple, fent cerques, sense necessitat d’especificar quins del 138 caràcters estem cercant, i poder així, buscar una ‘a’ seguida d’un ‘ke’, independentment de la variant específica en què aparegui en una epigrafia o en una altra. Des d’aquest punt de vista, l’agrupació inicial es va fer preguntant als experts, i en una fase posterior (a rel de la presentació de la proposta de codificació Unicode) se li fan fer uns petits retocs. Ara bé, les agrupacions de símbols que defineix, no està dissenyada amb criteris filològics, tot el contrari que la del grup LITTERA (que no defineix però al seu torn, quines variants tenen cada un dels símbols base). Es tracta doncs de quadrar aquests dos jocs de símbols.

I per fer-ho, es contempla el principi que si en un text es registra més d’una variant d’un mateix símbol (dues ‘a’s o dos ‘ki’s diferents, per exemple), això és indici d’intenció de diferenciació (com nosaltres bé diferenciem entre una lletra amb o sense accent, o una minúscula d’una majúscula). Tampoc és una qüestió de blanc o negre, petites variacions poden ser degudes a l’arbitrarietat de la mà que les va gravar, certament, però si aquestes parelles de ‘variants’ es troben en vàries epigrafies, sí cal pensar que no poden referir-se a un mateix ‘caràcter’. Si tot fos com Déu mana, amb els 49 signes bàsics elegits per els experts, hauríem de poder donar raó de totes les variacions presents en el corpus, sense cap contradicció important. Però no sembla ser així. Comencem.

Signes

En primer lloc, per simplificar, eliminem del signari de cathalaunia els símbols no fonètics (separadors i metrològics) i els definits, però que no existeixen (encara?) en el corpus epigràfic. Tenim:

sis-1

Signari fonètic present en el corpus.

I ara, marquem amb verd els 49 signes bàsics de la proposta per a Unicode (si n’hi han dos per una mateixa agrupació’ els diferenciem a base d’un to diferent de verd). El resultat, és[2]:

sius-1

Els signes de la proposta per a Unicode sobre el signari simplificat de cathalaunia.

Aquí tenim una petita inconsistència inicial. El símbol amb forma d’espiga amb tres punxes laterals no existeix en el corpus (i per això l’havíem eliminat en el pas anterior)! Peró sí que hi figura el de dues, de manera que probablement estem davant d’una d’aquelles inconsistències menors que dèiem. Ara bé, examinant el conjunt queda clar que les propostes són clarament diferents. Anant només a lo més evident: les vocals es desdoblen en la proposta per a Unicode, i tampoc hi ha un mateix nombre de grups consonàntics.

Una altra simplificació que podem fer, és mirar de reduir les variacions petites, diguem-ne ‘estilístiques’, com per exemple, marcar els signes que existeixen tan’ en formes ‘lineals’, de traç recte, com en formes arrodonides, i els que són molt similars a algun altre. Marquem doncs amb gris els símbols que fàcilment es poden igualar. El resultat és:

siusn-1

Símbols amb glif similar anotats en color gris.

I finalment, marquem amb blau la resta de signes sense marcar, que haurien de ser, a priori, les variants del signes assenyalats en verd de la proposta Unicode.

siuson-1

Possibles variants dels 49 signes de la proposta Unicode.

Veiem que gaire bé tenim candidats en totes les agrupacions.

Comparacions

Si la teoria és correcta, mai (o molt rarament) hauria d’aparèixer més d’una variant d’un mateix símbol base en una mateixa epigrafia. Així que el que s’ha fet és cercar i consignar quins signes apareixen amb quins altres en quines epigrafies (i de retruc, els que no apareixen mai junts). Com que hi ha molt a comparar i comentar, anirem per blocs i començarem per les vocals.

vocals-1

Les vocals.

Com podem veure, per a cada vocal la codificació Unicode assigna dos símbols (en verd clar i fosc).

A

Començant per la A, veiem que efectivament, les dues varietats de la codificació Unicode es poden trobar juntes en desenes d’epigrafies[3]. Per altra banda, veiem que les variants ‘estilístiques’ (en gris), són molt properes a les formes base, tret de la que té forma de R. Respecte aquest símbol, que existeix en 156 epigrafies, hi ha el dubte de si es tracta d’una A, o bé d’un símbol de forma semblant comentat en la proposta Unicode i considerat al·lògraf de r, que no figurava prèviament en el signari de cathalaunia (codi 247).  Sent però aquesta una possibilitat menor, i atès l’alt nombre d’aparicions en el corpus, mirem si es tracta d’una A, i si ho és, de quina de les dues de la proposta Unicode es tracta, si de la que té forma de P o la que sembla una D.

El signe el trobem al costat d’altres As en 17 casos: 7 (I00288, I00289 I00849 I00857 I02103 I02139 I02634) al costat de A’s amb forma de D,  7 (I00587 I00595 I00614 I01984 I02732 I03039 I03043) al costat de les de forma de P. Cal pensar doncs que la A amb forma de R és un símbol diferent al de les dues As de la proposta Unicode. I per rematar-ho, en aquest cas fins i tot el trobem al costat d’ambdues  menes d’As en 3 casos (I02138 I02578 I02579).  Aquí doncs tenim un primer símbol aparentment a afegir als ’49’.

També cal comentar que en la proposta Unicode es presenta un caràcter ‘a’ separat i de interpretació dubtosa (000105E4, a amb tilde). Es localitza en el corpus en 27 epigrafies, la majoria de monedes, però no exclusivament. Si el volem interpretar com una A, tenim que no podria ser la nostra ‘a’ amb forma de R, ja que els trobem junts, encara que això sí, l’evidència és mínima, ja que es donen en una única epigrafia. El trobem amb les As amb forma de P en unes menys de vint epigrafies, i amb l’A amb forma de D, també en unes poques entrades , i el que també resulta definitiu, al costat d’ambdues menes d’As en dos casos: I01231 I01927. Per tant, si fos una A, caldria pensar ser probablement una quarta varietat.

E

Si passem a les Es, les dues variants semblen diferenciar-se per el nombre de travessers, 2 o 3, però, un del de 3 presenta una orientació (cap avall) contrària a la resta de Es. En primer lloc, mirem si trobem les dues versions juntes, i efectivament, les tenim en un bon grapat de casos. El dubte és la forma que presenta tres travessers cap avall. I el que trobem és ben curiós: apareix en 23 epigrafies, un nombre no pas menor (i en una pluralitat de suports), però  desafortunadament, amb cap altra E! De manera que a priori no podem dir res en ferm, més enllà que sí sembla tenir un perfil propi ben marcat.

I

En les Is, sí hi ha conformitat plena entre la proposta Unicode, amb dos caràcters diferenciats, i les dues grafies recollides en el signari; i efectivament, existeixen juntes en desenes d’epigrafies, i per tant podem pensar que es tracten de dos caràcters diferents.

O

Per el que fa a les Os, les dues propostes per a Unicode es diferencien per tenir 1 o 2 travessers. En el corpus, les dues modalitats existeixen juntes en dues úniques epigrafies. La forma restant, la marcada en blau, i que es diferencia per tenir 3 travessers, la trobem en 12 epigrafies, però lo rellevant és que sí la trobem però, al costat de les dues Os de la proposta Unicode, tot i que en un únic cas per a cada una: I02599 i I03051. Per tant, tot i la migradesa de l’evidència, també podem proposar la O amb tres travessers com a diferent de les altres dues.

U

El cas de les Us, és més complicat. Les dues variants per la proposta Unicode, que gràficament semblen diferenciar-se per tenir un ‘barret’ senzill o doble, sols existeixen juntes en dues epigrafies d’un mateix objecte, una evidència mínima. L’altra forma, la marcada en blau, la trobem en 81 epigrafies, però entre elles, sols en 11 amb altres Us; en concret només el trobem amb el primer tipus, el que sembla una fletxa apuntat a dalt. Per tant, si és una U, podria ser una variant de la segona forma, o una lletra diversa, ja que la grafia és molt diferent. I en aquest sentit, sí cal ressenyar que també resulta curiós que tampoc es dóna mai al costat de les variants del símbol Du/Tu que tenen forma de triangle obert per baix, com el signe que ens ocupa. Queda per tant plantejat el dubte de si es tracta d’una U o un Du/Tu. Hi tornarem al parlar de les dentals.

Resumint: entre les vocals, tenim una A (o dues), i una O que no semblen compatibles amb cap de les variants de la proposta Unicode, i una E i una U dubtoses. Passem a les consonants.

consonants-1

Consonants.

L

Per el que fa a les laterals, la proposta presenta un únic símbol, cosa curiosa ja que l’altra grafia existent,la candidata, la de forma de V invertida, existeix en 535 entrades. I efectivament, es localitzen les dues juntes en desenes d’epigrafies. De manera que no sembla raonable pensar que es tracti d’un mateix caràcter.

NM

En les nasals, la concordança estructural entre les dues propostes és completa, un grup per N i tres per M.

N

Els quatre símbols per N són força semblants entre ells, tres d’ells formats per tres traços, variant sols al inclinació. L’únic candidat seria el darrer, el format per 4 traços, i el trobem en només tres epigrafies, totes elles d’un mateix tipus monetal, i sense cap altra N. Per tant, no es pot emetre cap hipòtesi de diferenciació, tant podria ser una N com les altres, com ser una de so diferent. Ara bé, entre els tres primers signes, tot i la semblança entre ells, tenim que la parella entre el primer i el segon el trobem en desenes d’epigrafies, i la del primer amb el tercer, en dos casos (I00003 i I00870), i 6 exemples entre el segon i el tercer (I00830, I00999, I01316, I01958, I02930 i I03027). El resultat, dons, és que tenim fins a 3 Ns diferenciables.

M

La primera M, la de forma de trident, té només una variant, que sembla estilística i que no es documenten mai juntes, per tant, no hi ha res a cercar.

La darrera, en forma de I llatina, presenta una possible variant en forma de T, (o I sense el travesser inferior). La que sembla una I llatina, es troba en només cinc epigrafies, i l’altra en tretze, i mai de forma conjunta. De manera que tampoc no es pot presentar cap hipòtesi, ni d’equivalència, ni de diferenciació.

La que sí presenta dubtes són les M en forma de Y o V. La proposta per a Unicode les considera un mateix símbol, i en tractar-se d’una única opció, no permet cercar diferenciació per exclusió. Entre les dues primeres variants en forma de Y es troben un parell d’exemples (I01980 i I02706) però sembla una evidència massa minsa com per proposar la seva separació. La de forma de V la trobem en 137 entrades, i les de forma de Y en 139. Ara bé, les dues variants existeixen juntes, en un unes poques epigrafies, i no semblen ser variacions estilístiques ja que es donen repeticions. Aixi que sí es podria plantejar que la M amb forma de V fos tal vegada diferent de les variants amb forma de Y.

R

Per el que fa a les vibrants, els dos grups (fort/fluix) presenten una única variant de grafia lo prou diferent com per no poder ser considerada a priori una ‘variació estilística’.

En el primer grup, la que sembla una P especular, es documenta en 36 epigrafies, i entre aquestes, amb alguna de les altres formes, en 17 casos. Un volum que fa pensar que certament  es pot tractar d’una R diferent.

En el segon, la variant en forma de rombe, que la trobem en 277 epigrafies, i coincidint amb alguna de les altres variants en forma de ‘chupachup’, en 44 epigrafies, una quantitat tampoc menor, i que sembla descartar la interpretació que estem davant de variacions estilístiques. Per tant podem estar davant d’una segona R extra a considerar. Encara que cal indicar la possibilitat que es tracti de la versió rectilínia del símbol Gu/Ku amb forma de O ja que es documenta al costat d’aquests signes en no poques ocasions.

S

Finalment, passant a les fricatives, la proposta per a Unicode, en contempla fins a quatre de diferents (una de les quals, però és suposada, i resta encara desconeguda). Per el que fa al grup de S amb forma de M, a semblança del cas de les Ns, tot i que la única variant sembla estilística, el fet, és que es documenten juntes en desenes d’epigrafies, i per tant, hem de pensar que estem davant de dues Ss diferents.

Les altres dos Ss, sí s’han de comentar. En primer lloc, certament, les podem trobar juntes en 22 epigrafies, i per tant, cal pensar que es tracta de dos caràcters diferents. Però la qüestió es que la variant amb forma de S, molt freqüent, ja que la troben en 673 epigrafies, la trobem al costat de les altres dues Ss en 21 ocasions, i fins i tot tenim tres exemples amb les tres Ss a l’hora (I02730, I02733 i I02738, tot i que provenen d’una mateixa localització). Per tant, també sembla raonable considerar la possibilitat d’afegir a la proposta per a Unicode una tercera S.

Recapitulem les consonants: tenim que podem estar davant d’una L, dues Ns, una M, dues Rs i dues S extres a afegir al signari bàsic.

Els següents grups a considerar són els sil·làbics, i són complicats d’analitzar per la major variabilitat sígnica que presenten (especialment amb la e) que fa difícil establir que són diferències estilístiques i què poden ser caràcters diferents. L’avantatja però, està en què en tenir alguns grups dobles, sí permeten fer proves per exclusió mútua.

Labials

labials-1

Sil·làbics labials.

A diferència de les oclusives i les dentals, la proposta per a Unicode no desdobla les labials (entre B/P), i per tant, en aquest cas sols podem mirar de verificar si les diferències són exclusivament ‘estilístiques’. La idea seria que si fossin variacions degudes a la mà de l’escriptor s’haurien de manifestar en un nombre baix de casos. Primer fem els casos més simples.

Ba

El símbol Ba, en tenir dos glifs tan semblants, fa molt difícil la diferenciació. La versió rectilínia, la tenim en 724 epigrafies, mentre que la corba sols en 27. Però també es detecten juntes en 6 casos (I01126 , I01132, I01191, I01239, I02018 i I03150). Tal vegada podríem pensar ser efectivament variacions d’estil, si no fos per que entre ells hi un cas (I03150) on figuren de costat i amb altres parelles de símbols semblants entre si, i per tant la voluntat de diferenciació és explícita. Atenent doncs a aquests casos cal plantejar-se si el que per forma semblava una variant ‘estilística’ no fos realment un caràcter diferent.

Bi

Quelcom semblant ho tenim amb el símbol Bi, on la variant es diferencia només per mostrar una corba menys ben definida. La forma més arrodonida la trobem en 122 epigrafies, i la més lineal, en 180. Juntes però sols les tenim en quatre casos : I01093, I01128, I02578 i I02697. En tractar-se d’un nombre baix de casos, i en tres d’ells en texts no massa curts, el dubte es manté; a falta d’altres criteris d’avaluació, tant podria tractar-se de variacions estilístiques com no.

Bo

En el cas del símbol Bo, la única variant afegeix un traç vertical, que és una de les maneres de diferenciar els sons en el signari dual. Sense traç, el trobem en 63 epigrafies, i amb traç, en 18, però en cap d’elles hi figuren juntes, de manera que no sembla possible diferenciar entre si estem davant d’un estilisme o d’una sonoritat diferent.

Bu

En el cas del Bu, una de les tres grafies és força diferent de les altres dues que són respectivament: un rectangle i un quadrat. Les de forma quadrada les tenim en 23 epigrafies, i l’altra en 12, cap d’elles conjuntament coincidents. Es podria tractar d’una variant, però el fet de trobar-se en un nombre comparativament alt de casos i de manera separada, sumat a la diferència en la grafia sí pot fer pensar en que es tracti d’un caràcter divers.

Be

El Be és el cas més complicat, ja que presenta un nombre no menor de formes (algunes d’elles inversions d’altres) que fan molt difícil la diferenciació entre estilisme i contingut. Atenent a que en el signari tenim exemples de com una rotació de 90º codifica una diferència vocàlica (Ka/Ke) sembla estrany pensar que una de 180º no indiqui res.

El que farem serà comptabilitzar quines variants figuren amb quines altres. Tenim que de totes les variants, sols cinc les trobem acompanyades per altres, i en un nombre limitat de casos. El més senzill és exposar el quadre resultant:

bes

Co-aparicions signes Be.

Començant per el final (de dreta a esquerra i de dalt a baix). Tenim tres signes que apareixen sempre sols i en poques ocasions: en dues epigrafies, en una única, i en tres. Per el que fa a les parelles, la primera, la trobem a: I02004, I02008 i I02581, i la segona, un únic cop a: I01128. Les altres dos parelles, que també estan incloses en els grups de tres, es troben a: I03081 i I02038. Els dos grups de tres, es troben cada un d’ells a: I02578 i I02772 respectivament.

La primera constatació és que un mateix signe amb una barra vertical afegida indica un caràcter diferent. De manera que tenim no menys de cinc glifs diferents: dos grups de símbols amb i sense barra vertical, que entre ells són capgirats verticalment, i la figura rodona amb tres puntes, que no es pot simplificar com una versió alternativa de l’altra figura que també presenta tres puntes cap a munt ja que existeixen juntes. La pregunta és: podem considerar la parella de signes amb les puntes cap avall, com una variant ‘estètica’ de la parella amb les puntes cap a munt? La resposta és no, ja que la primera combinació de tres repetiria signes. Sembla doncs que com a mínim cal considerar la possibilitat de l’existència de fins a 5 signes Be diferents. El problema principal, és que es documenten en pocs casos, i per tat seria una proposta que necessitaria una verificació a fons. Per el que fa a la forma, en la literatura s’ha descrit com una olla o un recipient, el que no s’ha expressat és que si efectivament es diferencien en formes invertides, el candidat més proper serien els signes de Caput i Cauda, coneguts des de Grècia fins a la Xina.

Resumint les labials: tenim un possible signe Ba extra, així com un Bu, i per les Be, caldria codificar-els amb cinc variants i no en una.

Dentals

dentals-1

Sil·làbics dentals.

Entre els dentals, tenim casos força complicats, començarem per els més simples.

Da/Ta

En els caràcters Da/Ta, tenim la diferenciació ja comentada entre, amb o sense traç vertical, i que efectivament trobem reflectida en desenes d’epigrafies on apareixen les dues formes conjuntament. El problema està en què la que en principi seria variant estilística de la versió amb barra vertical (la que té la barra segmentada), apareix en dues epigrafies al costat de la versió amb barra contínua; concretament a: I00601 i I01191. L’evidència és molt minsa però cal deixar constància d’aquesta casuística.

Do/To

Per el que fa als Do/To la diferenciació de la proposta per a Unicode sembla establir-se en el nombre de puntes que tenen els glifs entre 4 o 3, però el cas semble ser més complicat. Dibuixem les agrupacions existents.

do

Co-aparicions signes Do/To.

A semblança del cas del signes Be/Pe, tenim fins i tot un parell de ternes. Cert que la parella amb quatre i tres puntes és la més ben documentada (la primera, des de dalt), amb poc més d’una desena de casos. Però la segona parella, amb set exemples, són dues versions amb tres puntes. La tercera parella, així com la quarta sols tenen un únic exemple cada una: I02134 i I02599. Però la clau està en les ternes (I02139 i I02932), ja que permet entendre que el glif de tres puntes i base plana petita, el més probable és que sigui una variant del de tres amb base plana, no del de tres amb base en punta. Tenim doncs fins a quatre símbols Do/To diferenciats: el de quatre puntes, el de dos (tot i que és un hàpax), i dos de tres puntes (amb o sense base plana).

Di/Ti

El cas dels signes Di/Ti (amb figura de forca tots ells) s’assembla a l’anterior en el sentit que la proposta per a Unicode diferencia entre figures de quatre o tres puntes, però tenim també glifs amb dues puntes. Fem el mapa de repeticions per veure que trobem.

ti

Co-aparicions signes Di/Ti.

Si bé és cert que les parelles de quatre i tres puntes les trobem, certament, en desenes d’epigrafies, les parelles de signes amb les dues variants de tres puntes les trobem en quatre casos (I00084, I00184, I02195, I02697), i de tres amb dues puntes, en sis (I01982, I02009, I02017, I02051, I02105 i I03080). Sumat al fet de tenir un exemple amb la terna del de quatre i els dos de tres, (I03081), fan que no podem ajuntar les dues variants de tres puntes, ni tampoc considerar la de dues puntes com una variant ‘estètica’. La darrera parella, els de dos puntes, existeix en una única epigrafia (I02107) i faria pensar que el signe de ‘dues puntes i mitja’ fos una variant del de tres puntes, ja que apareix en una desena de casos, i per tant no es tracta d’un hàpax. Tenim doncs fins a quatre signes diferents, un de quatre puntes, dos de tres i un de dues.

Du/Tu

Per el que fa als signes Du/Tu la proposta per a Unicode sembla diferenciar els dos sons associats, entre gilfs amb forma de triangle net, i de triangle amb algun punt o línia afegida. Si mirem com s’ajunten en el corpus epigràfic aquests sis signes (més ben documentat, a dalt, menys, a baix) , tenim:

du-1

Co-aparicions signe Du/Tu.

La primera terna existeix en dues epigrafies (I02143 i I02982), les altres dues cada una en únic cas (I02138 la segona i I03132 la segona). Mirant de simplificar, es podria plantejar que el signe amb una barra perpendicular en la base (existent en 134 epigrafies)  i el que presenta aquesta barra desplaçada avall (existent en 15 epigrafies) siguin efectivament un mateix (que el segon fos una variació estètica del primer), tot i que formen la segona parella més freqüent: en cinc epigrafies (I01936, I02056, I02108, I02139, i I02772). La distribució doncs, podria fer pensar en ser dos signes diferents, però la seva semblança i el fet que la seva unificació no introdueix cap inconsistència, sí fa pensar que caldria considerar-los una mateix signe.

El següent intent de simplificació seria pensar si el triangle amb el punt (que el trobem en 18 epigrafies) no fos també una variant estilística del mateix signe amb una barra vertical. S’hi oposa el fet que gràficament són clarament diferenciables i també el fet que apareguin junts en dues epigrafies (I02777 i I03196) i en una d’elles, de costat. De manera que no sembla possible defensar aquesta simplificació. Tampoc sembla possible considerar els signes sense línia horitzontal com versions estilístiques dels que sí en tenen; el fet que els trobem junts en quatre ocasions (I00979, I03149, I03216 i I03218) i en dues de les ternes no ho permet. Sí podria ser el cas que el signe U amb forma similar a la variant de Du/Tu fet amb tres rectes convergents, que hem comentat abans, fos una versió estilística d’aquest, si més no, no es detecten mai junts.

Sembla doncs que tenim fins a cinc signes no simplificables: tres signes triangulars (net, amb línia, i amb punt central) i dos de forma de V invertida (amb o sense traç vertical).

De/Te

El cas del signe De/Te és de nou el cas més complicat, amb fins a 10 glifs que la proposta per a Unicode sembla diferenciar en si presenten figures dividides en quatre o dues parts. Mostrem el mapa de les seves aparicions conjuntes, ja que el cas sembla ser més complex.

de-1

Co-aparicions signe De/Te.

D’acord amb l’alt nombre de variants, tenim que la varietat de co-aparicions s’incrementa, però la quantitat de cada d’elles disminueix. Així, totes les ternes existeixen isoladament (de dalt a baix: I01994, I02777I02047I02107, I02016I02734I02105I02698). I entre les 12 parelles detectades (també de dalt a baix) tenim la primera amb un màxim de 10 aparicions, la segona , en 4 epigrafies, la mateixa quantitat que la tercera, la quarta, quinta i sexta en 3 casos cada una (I02695, I03133, I03150 i I01789 , I02124 , I02138 i I01994, I02045I02653) , la sèptima només en dos (I02028 i I02985), i les cinc restants sols en una cada una (I02682, I02730, I02125, I02986 i I00034).

Unes primeres constatacions. Formes corbes i lineals coexisteixen en molts casos i per tant, descarten que les corbes siguin variacions estilístiques de les rectes o viceversa. Tampoc una separació entre figures partides en quatre o dos parts sembla sostenir-se per si sola ,a ja que si bé sí és cert que la parella més ben documentada presenta aquesta divisió, també tenim parelles de dues i quatre variants. De fet, sembla que fins i tot podem descartar la diferenciació per ‘inclinació’ de la partició, ja que, per exemple, tenim parelles de dos parts que es diferencien per això.

Mirant de simplificar, podem pensar que atenien a dues diferències bàsiques: partides en dos o quatre i entre rodones o quadrades; això dóna quatre símbols base, però ens deixa amb el problema de la inclinació de les particions. Una primera aproximació seria deixar-ho com una variació lliure, sense significat, però la terna amb tres inclinacions diferents, i el fet que en les figures de dos mitats, tan rodones com quadrades, tenim exemples de línies verticals, horitzontals i inclinades, no permet pensar en casualitats. Afegim doncs que al fet de ser de quatre o dos parts i ser quadrades o rodones, si més no, en el cas de les partides en dos, la direcció de la partició importa i té tres possibilitats (horitzontal, vertical i inclinada), i en aquest cas, els dos signes ‘partits en dos’, es tornarien en sis de diferents, fent un total de 8 símbols diferenciables; i si ho consideréssim per els partits en quatre parts, llavors el total pujaria fins els 10. Ja sigui la partició en quatre signes (ignorant les inclinacions) o en vuit o deu (tenint-les en compte) el que sí queda clar és que una partició en dos resulta excessivament simplificant.

Resumint les dentals: tenim un grapat de signes extres a considerar, un possible Da/Ta, entre 2 i 8 signes més De/Te, dos signes Di/Ti més, dos signes més Do/To i tres signes Du/Tu a afegir als de la proposta per a Unicode.

I finalment passem als signes sil·làbics amb velars:

guturals-1

Sil·làbics amb velars.

Farem com en el altres grups i començarem per els més senzills.

Gu/Ku

La proposta per a Unicode diferencia dues variants segons tinguin o no un punt al centre. Certament, de parelles de signes rodons amb i sense punt se’n troben fins a vuit en el corpus, l’inconvenient està en què les versions amb punt, lineals i rodones, es troben en dues epigrafies (I02653 i I03050) i en ambdós casos la intencionalitat sembla clara (en un d’ells, fins i tot van de costat). De manera que es pot defensar que cal contemplar com a tercera variant el rombe amb punt al mig; i recordar aquí que per figura i distribució, el signe R amb forma de rombe comentat abans, podria tractar-se d’una variant d’aquest grup.

Go/Ko

En el cas del signe Go/Ko la proposta per a Unicode segueix la norma de diferenciar les dues variants (amb forma de clepsidra) segons si té o no una línia vertical. Certament aquesta és la combinació majoritària, amb 10 aparicions. Per el que fa als altres dos signes (que presenten la clepsidra en posició horitzontal), el que mostra un traç vertical sols es documenta aïlladament i en tres ocasions. L’altra, que apareix en total en 8 epigrafies, apareix però en una, al costat de la figura en posició vertical (I03220). Tenint en compte els altres casos examinats, no sembla raonable ignorar cap del dos signes horitzontals, tot i que certament l’evidència és mínima.

Ga/Ka

Per el signe Ga/Ka la proposta per a Unicode les separa segons si tenen una o dues línies curtes. Però el recull de les agrupacions mostra quelcom diferent.

ga-1

Co-aparicions signe Ga/Ka.

Tenim que tant els dos signes amb una sola línia curta, com el dos que en tenen dues, figuren junts, i en un nombre no menor de casos. I és de notar que tots quatre signes es documenten en desenes/centenes d’epigrafies.

La primera terna es documenta en quatre epigrafies (I02578 , I02682, I02738 i I02982). La segona però sols en una (I02107). I entre les parelles, (de nou, de més a menys i de dalt a baix), la primera la troben en 10 casos, la segona, formada per els signes amb una única línia en 7 epigrafies, la tercera, amb les dues variant amb dos línies, en 5 entrades del corpus, la quarta  en 6 ocasions (sic), la quinta en 3 epigrafies (I01895 , I01987 i I02695)  i la sexta en una única ocasió, I01982. De manera que cap de les variants, ja sigui amb dues o una única línia, pot considerar-se  una versió estilística de l’altre, tota vegada que es documenten juntes en un nombre no menor de casos. Tenim doncs que cal contemplar fins a quatre signes Ga/Ka.

Gi/Ki

El símbol Gi/Ki (genèricament amb forma de Z), es dóna en 6 variants, i la proposta per a Unicode sembla diferenciar-los per si tenen un traç medial en la figura, encara que en el repertori hi han també glifs amb doble traç, especulars, i girats 90º.

ki-1

Co-aparicions signe Gi/Ki.

El quartet i les dues ternes es donen en una única epigrafia cada un d’ells (I01923, I01191 i I02016) i permeten apreciar que es diferencien clarament entre signes especulars i entre una, dues o cap línia medial, així com signes rotats 90º, en altres paraules, totes sis variants es comporten com signes diferents. Les parelles també refermen aquesta consideració: la primera existeix en 10 epigrafies, la segona en 4 casos, la tercera, també en 4, les dues següents en dos casos cada una (I02677, I03027 i I02699, I02732) i les altres quatre cada una en una única ocasió (I02154, I02155, I03197 i I03216). O sigui que en comptes de dues variants, cal considerar-ne 6, segons nombre de línies medials, rotació i inversió especular.

Ge/Ke

El signe Ge/Ke amb 12 variants, torna a ser el més complex d’analitzar. Al tenir moltes variants, les co-aparicions augmenten però amb menor suport. Entre les 12 variants, tres d’elles apareixen sempre aïllades: la corbada amb doble línia vertical, que es troba en 7 epigrafies, la que està girada cap avall i amb una ínia, que és un hàpax, i la que sembla una G, que trobem en 3 epigrafies. Les altres variants conformen el següent quadre de co-aparicions:

ke-1

Co-aparicions signe Gi/Ki.

Tant el quartet com les quatre ternes existeixen cada una en una epigrafia pròpia (I02138, I03080, I02139, I01923 i I02661). La parella més freqüent es troba en 7 epigrafies, la segona en 5 casos, la tercera en 3 (I01126, I02698 i I02699), la quarta i quinta en dos (I01929I02123 i I01127, I02578) i les cinc restants en una única (I01938, I00028, I02016, I01256 i I01316).

La primera constatació és que, de nou, es diferencia entre tenir o no una línia vertical. La segona, és que també diferencien entre signes corbs i rectilinis, l’evidència no és molt abundant, però si múltiple (tres ternes i quatre parelles). Queda el dubte de si les versions amb traç vertical curt es poden considerar variants estilístiques de les de traç llarg, l’evidència en contra és també curta però de nou múltiple (el quartet, dues ternes i una parella). La última diferenciació possible a comprovar és entre les que tenen el traç curt a dalt o a baix; en aquest cas sols tenim un contraexemple (la segona terna), i per tant a priori sembla millor ignorar aquesta diferenciació. Tenim doncs figures corbes i lineals i cada una d’elles amb tres possibilitats: sense, amb línia vertical, i amb traç curt. Un total de 6 signes Ge/Ke a considerar (3, si en contra l’evidència es volguessin igualar les figures corbes i les rectilínies, o en sentit contrari, 8 si es decideix separar per posició del traç curt).

Resumint les velars: cal considerar 2 signes Ga/Ka més, entre 4 o 6 més en el cas del signe Ge/Ke, també 4 més per el que fa al signe Gi/Ki, potser també 2 signes Go/Ko extres (els ajaguts), i 1 variant més per el signe Gu/Ku.

Conclusions

De l’anàlisi de les co-aparicions de variants del que es suposa ser la representació sígnica d’un mateix so bàsic, es desprèn que la variabilitat és molt superior a l’¡esquematització filològica moderna (resumida, per exemple en la proposta de codificació Unicode  per a l’ibèric nord-oriental presentada el 2015). Encara que les propostes de partició de signes, no sempre són unívoques, ni tampoc sempre ben evidenciades, el volum fa que no es pugui ignorar la discrepància. Llistem les agrupacions del signari simplificat de cathalaunia anotant primer el nombre de signes segons la proposta Unicode i al costat els detectats en aquesta anàlisi[4].

  • A 2 vs. 3-4
  • E 2 vs. 3?
  • I 2 vs. 2
  • O 2 vs. 3
  • U 2 vs. 3?
  • L 1 vs 2
  • M 1 vs. 1
  • M1 1 vs. 2
  • M2 1 vs 1.
  • N 1 vs 3
  • R 1 vs. 2
  • R1 2 vs. 3
  • S 2 vs. 3
  • S1 1 vs 2
  • Ba/Pa 1 vs. 2
  • Be/Pe 1 vs. 5
  • Bi/Pi 1 vs. 1
  • Bo/Po 1 vs. 1
  • Bu/Pu 1 vs. 2
  • Da/Ta 2 vs. 3
  • De/Te 2 vs. 4-10
  • Di/Ti 2 vs. 4
  • Do/To 2 vs. 4
  • Du/Tu 2 vs. 5
  • Ga/Ka 2 vs. 4
  • Ge/Ke 2 vs. 6-8
  • Gi/Ki 2 vs. 6
  • Go/Ko 2 vs. 4
  • Gu/Ku 2 vs. 3

La proposta Unicode presenta 46 entrades, mentre que el recull trobat en aquesta anàlisi apunta a una forquilla de entre 85 i 96 signes diferents.

Les preguntes que tal discrepància genera són molt bàsiques i necessiten d’una resposta filològica. N’apuntem sols unes quantes a tall d’exemple.

  1. En conjunt, no resulta possible escapar a la impressió que la llengua ibèrica codificava aspectes que actualment no estan sent contemplats: quins podrien ser?
  2. En aquest sentit, quin podria ser el motiu per el qual els signes sil·làbics amb E presentin més variants?
  3. Existeixen paral·lels de la partició entre vocals, consonants i els tres grups sil·làbics que presenta l’ibèric en altres llengües antigues?

Preguntes que escapen l’àmbit d’aquesta anàlisi, i que sols poden ser emeses a l’espera que la Filologia i la Filologia Històrica ens presentin respostes. En tot cas, sembla clar que la posició que defensa que sense tenir en compte la complexitat real del missatge difícilment serem capaços d’entendre el seu significat (una posició eminentment lògica), sembla trobar confirmació en aquesta anàlisi de les variants dels caràcters de l’ibèric nord-oriental, que de fet, presenta una quantitat de signes força propera als 95 del recull d’Untermann.

Coda

Finalment, la confecció d’aquest apunt ha acabat donant lloc a un nou article: Vilaseca i Corbera, Joan : 2016 : “Els caràcters de l’ibèric nord-oriental”. Qui ho vulgui, allà trobarà la mateixa informació d’aquest apunt, però suplementada amb les dades de totes les co-aparicions del corpus en el seu Apèndix A.


Notes

Publicat dins de Carme J Huertas, cathalaunia.org, codificació, David Folch, epigrafia ibèrica, grup LITTERA, ibèric nord-oriental, Iberika, ibers.cat, Javier Velaza, Jürgen Untermann, Joan Ferrer i Jané, Noemí Moncunill, signari simplificat, UB, Unicode | Etiquetat com a , , , , , , , , , , , , , , , | Deixa un comentari

2016-setembre a cathalaunia.org

S’acaba setembre i cal fer repàs. Ha estat un mes de treball molt intens, centrat majoritàriament en el Fons Cathalaunia, i en segon terme, en l’àrea de les epigrafies Ibèriques. De fet, ha estat tant intens que fins i tot s’han pogut completar algunes de les tasques i/o millores que es projectaven per el web cathalaunia.org i que es van explicar ara farà un parell de mesos.

El mes va començar ibèric. En primer lloc, es van afegir les novetats del corpus de ibers.cat, i es va processar el darrer número de la revista Paleohispanica, el del 2015 (amb un article, que la veritat és que ha fet aixecar les celles un parell de cops mentre es llegia, però d’això ja mirarem de parlar-ne en un apunt propi, que un resum mensual no és el lloc  adequat per entra-hi amb un cert detall).

També s’ha incorporat en les epigrafies del corpus, les aparicions dels signes metrològics definits en la proposta de codificació Unicode del signari ibèric nord-oriental (no existien en la codificació original de ibers.cat). El signes ja s’havien definit en el Signari de cathalaunia.org així que es va tenir accés a la proposta, ja fa mesos, però faltava incorporar-los en les epigrafies del corpus, on fins ara, apareixien com: ‘símbol desconegut’. Encara falta incloure els fraccionaris (crec que existents sols en el monedatge) i altres són dubtosos, ja que es confonen símbols llatins i ibèrics (homòglifs, que tenen glifs similars, com per exemple la lletra I i el símbol Ba ibèric), però la resta, ja estan incorporats i les futures novetats epigràfiques també els podran emprar directament.

Però a més, s’ha posat fil a l’agulla a una de les millores prèviament projectades. S’ha reconvertit el que era una pàgina de ‘Repeticions‘ on hi havien ordenades totes les cadenes de símbols que existeixen en més d’una epigrafia, en una pàgina de ‘Seqüències‘, que no és res més que el mateix que hi havia abans, però amb l’afegit de llistar també totes les cadenes de signes que sols existeixen en un únic epígraf. Per fer-ho, s’ha millorat la infraestructura de càlcul necessària per detectar i enumerar totes les seqüències de més d’un signe. El resultat final, és que ara, en aquesta pàgina de ‘Seqûències‘ es disposa d’un índex global de totes les cadenes existents en el corpus en un moment donat. Una referència de consulta bàsica en línia i actualitzable automàticament (és a dir, que les futures adicions al corpus no requeriran de cap treball extra per aparèixer en aquest índex).

També es va començar a avaluar la possibilitat de crear un ‘proto-lexic’, un lloc on recollir les propostes de traducció de les ‘paraules’ o ‘afixes’ (una altra de les ‘millores’ previstes). El problema principal, és que la majoria de propostes no han estat publicades i per tant no és possible donar-hi les referències imprescindibles (el web no pot presentar dades sense especificar-ne una font externa i verificable). Sí que hi han articles sobre afixes i alguns sobre algunes ‘paraules’, però el gruix, (i els experts maneguen centenars de termes) resta de moment en l’àmbit privat i fa de mal aprofitar. Continuarem intentant-ho…

En el futur més proper sí es preveu un parell més de millores i que també s’han estat treballant aquest mes: una eina de concordances entre grups arbitraris d’epigrafies, i la codificació de versions d’una mateixa epigrafia. Ja en parlarem a la que s’hagin posat a l’abast del públic.

La tasca prosopogràfica del Fons Cathalaunia s’ha endut però la part del lleó. No sols s’ha processat completament l’any 886 (que s’havia encetat tot just el mes passat) sinó que fins i tot s’ha fet una part substancial del 885. El resultat és fàcil d’enunciar: la llista de Documents creix fins les 976 entrades. Per descomptat, hi haurien un pilot de coses curioses i interessants a comentar, però la pressió per aprofitar la dinàmica de treball passa per davant, i així que s’acaba d’incorporar un text, ja es comença a processar el següent. Cada un és una història nova, i tots tenen el seu interès, a vegades discret o potser molt especialitzat (per exemple, identificant masovers), a vegades cridaner (com tot un senyor rei fent d’abat anònimament). Alguns parlen d’episodis notables i controvertits, com el famós concili de Portus de finals del segle IX, altres de transaccions aparentment anodines, però la tasca prosopogràfica els iguala. Tots presenten persones i llocs que cal intentar identificar, i descriuen fets a consignar (siguin reals, inventats o migpensionistes).

La tasca prosopogràfica és lògicament prèvia a l’estudi del context, però això només és cert a mitges. Per dues raons: en primer lloc, perquè cal conèixer un mínim el context del document que s’està processant, i per l’altra, perquè en una tasca prosopogràfica sistemàtica, es va formant un pòsit força difícil de conceptualitzar, diguem-ne una familiaritat, en la qual els diferents episodis i els corresponents modismes que cada text aporta es van trenant naturalment entre sí. Poso un exemple personal i que pot ser fàcilment compartit per els coneixedors de l’alta edat mitjana catalana.

En el cas del concili de Portus que dèiem, havia llegit fa anys els magnífics treballs d’en Bautier, i tenia classificat el suposat concili com inventat, però un cop processes les evidències, te n’adones que la premissa bàsica de tal posició (que l’evidència derivava exclusivament de la Vita Sancti Theodardi), no és del tot correcte. Per una banda hi han unes poques dades en el document del suposat concili no presents en la Vita, i per altra, et trobes que no costa pensar que la interpretació del conjunt (un suposat nomenament d’un arquebisbe tarragoní) és pot resoldre si separem l’element tarragoní , certament anacrònic, del sí creïble i coherent amb el context, possible intent de nomenament d’un arquebisbe al sud de la Gòtia amb l’ajud del comte Sunyer, que va ser contrarestat per l’arquebisbe de Narbona i la branca del Pilós.

És sols una enunciat, caldria lògicament escatir-ho a fons, però és un exemple puntual de com en conjunt, s’albira que el recull de dades que s’està construint permetrà estudis amb un nivell de detall i profunditat abans difícilment realitzables.

Si considerem només el comtats ‘catalans’ (els del sud de la Gòtia), la dècada dels 880 marca l’inici d’un registre documental quantitativament significatiu, o dit al revés, no tenim a penes documentació local anterior al Pilós. Això no és tan així en la resta de territoris coberts per el Fons, però sí que globalment es dóna un descens en les quantitats de documents disponibles. És justament per aquest motiu que es procedeix cronològicament en ordre invers en la incorporació de nous documents en el Fons.

El tema de la quantitat de documentació per any es complicat. Un mateix document pot tenir vàries datacions, com també tenim documents sense data i que només podem datar per interval (a voltes, purament genèric). L’eina per visualitzar el nombre de documents disponibles per cada any en el Fons, està en la pàgina d’Anys, on  es pot veure la quantitat de documents disponibles per cada any. Posant el punter sobre la xifra de l’any, es mostren dos números: el primer correspon al nombre de documents explícitament datats per aquell any (i cal pensar que un document pot estar datat per més d’un any), i el segon, indica la quantitat de documents datats per interval que afecten aquell any. Clicant l’any, accedim a la llista de documents corresponents.

Aquest bloc s’ha vist orfe de nous apunts. No és pas que faltin temes a comentar, ni tampoc les ganes de fer-ho. El que ha faltat, és trobar els temps necessari per dedicar-se a posar-ho negre sobre blanc, ja que la majoria de les coses que es volen comentar requereixen d’un cert treball per exposar-les com cal. Així que es pugui es mirarà de donat-hi sortida, si més no als temes relacionats amb alguns dels documents que es van incorporant en el Fons, ja que el que treballes mentre els processes (que és quan es troben les coses a interessants a comentar), a mida que passen els dies es va allunyant del record i convé no deixar-ho per massa endavant.

El que sí s’ha afegit és un parell d’actualitzacions: una, en l’apunt sobre masovers que es va fer ara farà uns mesos, i l’altra, anual, i forçada per l’actualitat, en l’apunt sobre l’onze de setembre de 878.

En la Bibliografia, l’activitat ha estat mínima, a penes hi ha hagut temps per llegir . Això no vol dir que no hi hagin noves incorporacions o que siguin menors, però sí assegura que la cua de lectures pendents ha continuat creixent. En algun moment s’haurà de dedicar temps a la lectura…!

El que sí s’ha pogut fer en aquest apartat, és completar una de les tasques pendents que es comentaven en l’apunt de resum del mes passat: automatitzar en el nou índex global d’autors les referències provinents d’autories múltiples. Una millora sistèmica més.

Seguint el costum, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Alta Edat Mitjana:

A fi de mes, cathalaunia.org presenta 26.453 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.
Publicat dins de 886, anys, Bibliografia, cathalaunia.org, cronologia, epigrafia ibèrica, Fons Cathalaunia, Gòtia, Guifré Pilós, ibers, ibers.cat, masovers, Portus, prosopografia, Repeticions, seqüències, Sunyer, Tarragona, Unicode, Vita Sancti Theodardi | Etiquetat com a , , , , , , , , , , , , , , , , , , , | Deixa un comentari

2016-agost a cathalaunia.org

Agost acostuma a ser un mes nefast i aquest no ha estat una excepció.

La Roda de la Vida ens ha deixat sense un referent local: en Frederic Santaulària i Roig, un exemple d’honestedat intel·lectual, apertura mental i amor per l’estudi dels nostres orígens.  Anima mater, a parer meu, de l’Institut d’Estudis Ibers des de on ha estat aquests darrers 16 anys contagiant l’interès per el món dels ibers i l’estudi de la Història a centenars de persones organitzant anualment cursets gratuïts d’introducció a la temàtica ibera. Aules pràctiques de lliurepensament on tota opinió té lloc i respecte, i on des de la sinceritat s’intercanvien treballs i idees en la recerca de la comprensió del nostre passat. Un plaer rar en la banalitat imperant. Tot i que ens queden els seus llibres no hi ha manera de suplir la seva absència. Podem però sí, mirar de continuar la seva tasca: l’estudi dels orígens dels ibers, i fer-ho, sent fidels al seu mateix esperit de sinceritat, apertura i rigor. No sabria fer millor homenatge.

Per el que fa al web l’activitat s’ha centrat en el Fons Cathalaunia. S’ha completat l’any 887 i encetat el 886 (un any també poc nodrit en quantitat de documents), de forma que el nombre de documents arriba als 950 (i de retruc el nombre de pàgines total ha superat la marca dels 26.000).

Aquest bloc ha rebut un apunt per retratar la situació actual i properes evolucions del web cathalaunia.org, el temps dirà si l’hem encertat gaire, o no.

Un dels canvis del mes ha estat en la organització de les seccions Bibliogràfiques ja que s’ha creat un índex global automàtic d’Autors (una idea que feia temps que es volia implementar). Falta encara polir alguns detalls (els noms dels autors no sempre estan escrits igual) però ja és plenament operatiu (incloent les obres d’autoria múltiple). Més enllà d’això, la cua de lectures pendents continua molt per sobre dels quatre cents títols, tot i que la lectura no ha estat pas poca.

Seguint el costum, llistem les incorporacions del mes per seccions[1]:

Secció Bibliografia de l’Època Prehistòrica

Secció Bibliografia de l’Època Ibèrica i Romana:

Secció Bibliografia de l’Època Visigoda:

Secció Bibliografia de l’Alta Edat Mitjana:

Secció Bibliografia sobre Judaisme

Secció Bibliografia Vària:

A fi de mes, cathalaunia.org presenta 26.157 pàgines consultables.


Notes

  • [1] Es marquen amb (www) les entrades que es poden trobar lliurement a Internet.
Publicat dins de 886, 887, Bibliografia, cathalaunia.org, Fons Cathalaunia, Frederic Santaulària i Roig, ibers | Etiquetat com a , , , , , , | Deixa un comentari