Usuario:Pybalo/Proyectos/2004/Expandiendo

De Wikcionario, el diccionario libre

Miniproyecto: {{Expandiendo}} el Wikcionario[editar]

Motivación[editar]

Cuando conocí Wikipedia llegué a través de un artículo sobre el formato Postscript. Mi primera contribución en realidad no fué a la Wikipedia misma sino a su hermano "menor" el Wiktionary. Agregué una traducción de Sandbox en la versión inglesa y creé la entrada Arenero en nuestra versión en castellano. Luego tuve que deshacer algunas modificaciones imprudentes que hice en la versión inglesa: no me había percatado de la complejidad interna del Wiktionary. He aquí la paradoja: es mucho más sencillo ponerse de acuerdo en los contenidos de un artículo enciclopédico que la "simple" entrada de una palabra en el diccionario. Entre los ambiciosos objetivos del wikcionario se encuentran brindar información sobre:

  • definiciones
  • distintas acepciones (desambiguando o no)
  • pronunciación (IPA, SAMPA)
  • etimología (origen, significación, forma)
  • traducciones
  • otras que seguramente no recuerdo...

Y lo que suena más extraño es que cada versión del Wiktionary (español, inglés, francés) contiene no sólo entradas para las palabras propias de su idioma, sino que contiene también las palabras de otros idiomas, explicadas en el idioma propio. Por ejemplo, si visitamos:

http://en.wiktionary.org/wiki/Sustantivo

encontraremos que "Sustantivo is a spanish word than means noun" y en

http://es.wiktionary.org/wiki/Noun

que "Noun es la palabra inglesa para designar sustativo"

He ahí una de las razones por la cual es tan difícil desarrollar el Wikcionario: hay muchos intereses contrapuestos en conflicto. A la larga, trabajar en la enciclopedia resulta una experiencia más realimentadora, supongo. Pero creo que no deberíamos olvidarnos de este proyecto, tiene reservado un lugar privilegiado como compañero de la enciclopedia.

Una de las críticas que he leído por ahí es que la información del Wikcionario no debería ser tan "desestructurada", que los contenidos deberían ser mucho uniformes y formateados como si de una base de datos se tratara. El uso de plantillas o modelos de páginas ha intentado cubrir esta demanda pero tienden a ser bastante difíciles de mantener o suelen quedarse obsoletas ante nuevos requerimientos y eso obliga a un gran trabajo de reedición.

Mi poca experiencia con las plantillas del software MediaWiki, esos códigos entre llaves {{xxx}} que se expanden convirtiéndose en otro texto (no confundir estas plantillas-templates con las plantillas-modelos antes mencionadas) me llevan a pensar que podrían ser una valiosa herramienta para formatear y categorizar los contenidos del Wikcionario.

Lo que quiero presentar aquí es un simple esbozo de la idea... la forma final se debería construir con la sabiduría de los entendidos en linguística (como Javier Carro y Piolinfax entre otros :))

He elegido proponer esta idea aquí en la enciclopedia y no en el wikcionario por dos motivos:

  1. Los habitués del wikcionario generalmente lo son de la Wikipedia, pero no se da a la inversa
  2. No quiero estropear ningún contenido del Wikcionario hasta que se pueda demostrar real utilidad

Propuesta[editar]

Plantillas para generación de contenidos[editar]

Con unos mínimos conocimientos de lingüística y un poco de paciencia, se pueden hacer cosas realmente interesantes. Por ejemplo: ¿que estudiante de primaria no ha tenido que lidiar con "el pretérito pluscuamperfecto del modo subjuntivo del verbo amar"? Seguramente está en algún libro. Y el del verbo "despanchurrar"? Yo no lo he visto en ninguno, pero gracias a las plantillas (por ser un verbo regular que sigue la forma de amar) podríamos visualizarlo en el Wikcionario de una manera similar a los siguientes enlaces:

amar -> despanchurrar
temer -> comer
partir -> asistir

Si alguien quiere ayudarme, habría que seguir con los verbos irregulares y auxiliares. ;)

Plantillas de abreviaturas y categorización[editar]

amar es una palabra castellana, es un verbo y es transitivo
amor es una palabra castellana, es un sustantivo y es masculino y singular
love es una palabra inglesa. Según el idioma inglés, Love es un verbo transitivo y también es un sustantivo contable e incontable

¿Cómo se representa esta cantidad abrumadora de información habitualmente en los diccionarios? Para ahorrar papel y tinta, los diccionarios han desarrollado un código muy escueto de abreviaturas, ininteligibles para los no iniciados pero práctico para los conocedores. Generalmente leemos

amar v.tr. Sentir amor por alguien o algo...
amor m. Sentimiento experimentado...
love v [T not in progresive] To have a strong feeling...
love n [U] A strong feeling of...

El mismo logotipo del Wiktionary sigue esta regla!

Mi propuesta es: tomemos este sistema de codificación casi universal y usémoslo en plantillas de abreviaturas. Al marcar una palabra con "{{m.}}" la estaremos definiendo como un sustantivo masculino de manera similar a la de un diccionario estándar, con la ventaja de que:

  • podemos mostrar la abreviatura compacta (apto para un volumen de impresión importante)
  • la abreviatura puede ser un hipervínculo a su explicación desarrollada
  • si queremos, en vez de expandir a m. expandimos a (sustantivo masculino)
  • al mismo tiempo agregamos la palabra a una o más categorías, como por ejemplo: pronombres personales, verbos irregulares, adverbios de tiempo, etc. (asumo que no hay un lìmites para la cantidad de entradas que puede tener una categoría)

El siguiente es un esbozo grosero de posibles plantillas candidatas

  {{s.}}         -> español, sustantivo
  {{f.}}         -> español, sustantivo femenino
  {{m.}}         -> español, sustantivo masculino
  {{pref.}}      -> español, prefijo
  {{adv.}}       -> español, adverbio
  {{adv.l.}}     -> español, adverbio de lugar
  {{adv.t.}}     -> español, adverbio de tiempo
  {{adv.m.}}     -> español, adverbio de modo
  {{adv.lt.}}    -> español, adverbio de lugar y tiempo
  {{adv.pron.}}  -> español, adverbio pronominal
  {{adv.inter.}} -> español, adverbio pronominal interrogativo
  {{adv.afirm.}} -> español, adverbio pronominal afirmativo
  {{conj.}}      -> español, conjunción
  {{prep.}}      -> español, preposición
  {{fam.}}       -> español, familiar
  {{adj.}}       -> español, adjetivo
  {{v.t.}}       -> español, verbo transitivo
  {{v.i.}}       -> español, verbo intransitivo
  {{v.it.}}      -> español, verbo transitivo e intransitivo
  {{v.p}}        -> español, verbo pronominal
  {{v.tp}}       -> español, transitivo y pronominal
  
  {{.es}}        -> español
  {{.en}}        -> inglés
  {{.en.v.}}     -> inglés, verb
  {{.en.n.}}     -> inglés, noun
  {{.en.pron.}}  -> inglés, pronoun
  {{.en.phr.v.}} -> inglés, phrasal verb
  {{.en.adj.}}   -> inglés, adjective
  {{.en.adv.}}   -> inglés, adverb
  {{.en.n.c.}}   -> inglés, noun contable
  {{.en.n.u.}}   -> inglés, noun uncontable
  {{.en.v.t.}}   -> inglés, verb transitive
  {{.en.v.i.}}   -> inglés, verb intransitive
  {{.en.v.it.}}  -> inglés, verb transitive and intransitive

El punto final podría sería la característica distintiva de estas plantillas de abreviaturas. Para prevenir colisiones de nombres, las abreviaturas de otros idiomas las he marcado con un . inicial seguido del código del idioma, asumiendo que los identificadores abreviados que más usaríamos serán los de español.

Un ejemplo final[editar]

El resultado final sería que al editar una entrada como "amar" escribiésemos algo como

{{.es|amar}} {{v.t.}} Sentir amor por alguien... 
'''Conjugación'''
{{Gramática.Conjugación.am-ar|raíz=am}}

y resultara en algo similar a...

español

amar. v.tr. Sentir amor por alguien...

Conjugación Plantilla:Gramática.Conjugación.am-ar

¿Qué les parece? Si hay quórum propongo hacer pruebas en subpáginas de esta página u otra que propongan, a manera de un miniWikcionario de testeo. Espero sus comentarios, críticas, sugerencias... o lo que sea que quieran enviarme! :) --Pybalo 06:31 16 ago, 2004 (CEST)

Discusión[editar]

Tengo que decir que ando desvinculado del Wikcionario. Conozco algo de esas largas discusiones para crear LA(-s) PLANTILLA(-s) definitiva allí. Espero que algún día se consiga. Pienso que dicha(-s) plantilla(-s) son los cimientos para construir un buen diccionario, osea que es muy, muy importante. Tu propuesta me parece fabulosa. Un milagro más de uno de los expertos programadores con los que la Wiki cuenta. Me encantaría ayudarte a hacer las otras formas verbales aunque no me pillas en un momento con mucho tiempo libre y creo que lo mejor es llegar primero a un consenso, es decir, vamos a oir más opiniones (¿Lo has anunciado en el Café del wikcionario?) y luego podemos pasar a crear las otras plantillas si nadie se opone. Cuenta con mi apoyo, aunque abro los oídos para posibles propuestas que lo mejoren, (vamos a ver quién se atreve...) ;-)

E incluso, se podría crear un bot en el que los verbos estuviesen organizados por grupos, por un lado regulares o irregulares (dentro de los irregulares habría que ver las distintas posibilidades), y por otro lado -ar, -er, -ir. Y así llenar las conjugaciones. Por cierto, el otro día creé una especie de código para clasificar y ordenar de forma sencilla los distintos verbos irregulares alemanes según el tipo de irregularidad, algo parecido se puede hacer con el español. Aunque esta idea la dice uno que no tiene ni idea de programar en internet, así que la lanzo al espacio estelar por si un mago-wiki-programador puede hacerla posible. Por lo que veo en algunos casos, cuando una wiki esta muy floja, los bots pueden dar cuerpo rápidamente y así podemos intentar relanzar un proyecto. --Javier Carro 09:23 16 ago, 2004 (CEST)


Creo que hay unas 100 conjugaciones verbales distintas, sumando verbos irregulares, defectivos, con dos formas... Una idea es crear una entrada Wikcionario:Conjugaciones con la lista de todas las conjugaciones regulares e irregulares con un ejemplo de cada y el código de la plantilla en nowiki para que se pueda copiar y pegar fácilmente. Un ejemplo de código sería {{es.verbo.reg.ar}} para verbos regulares de la primera conjugación. También se pueden hacer plantillas parecidas con verbos franceses y de otros idiomas, aunque eso se puede dejar para más adelante. En un principio, yo empezaría con los verbos regulares, que son unos cuantos. No ayuda mucho a que la gente con dudas aprenda las conjugaciones, pero le da cuerpo al wikcionario.
Incluso propondría la inclusión del voseo en la conjugación de los verbos. Sabbut 11:13 16 ago, 2004 (CEST)

Vale! Esa es la idea! Que la mayor cantidad de gente opine! No hace falta ser experto en programación ni en lingüística, pero esto último daría el rigor que necesita el Wikcionario. Una observación con respecto al nombre de las plantillas. Por ahora elegí incluir el nombre del verbo modelo para utilizar la misma sintaxis con los regulares. Por ejemplo tendríamos plantillas para

  • amar: am-ar -> despanchurr-ar
  • temer: tem-er -> com-er
  • partir: part-ir -> asist-ir
  • decir: d-ecir -> pred-ecir (por d-ijo, pred-ijo)
  • imprimir: impr-imir (por impr-eso)

etc. La idea es que el guión nos indique las partes constantes y variables, raíces y ¿desinencias se dice? Saludos --Pybalo 17:15 16 ago, 2004 (CEST)


Funcionando como funcionan las categorías actualmente, esto sólo vale para verbos "bastante regulares"; el verbo ser, por ejemplo, sería imposible. Aún así, estoy seguro de que estas plantillas serán muy útiles en el Wiktionario. A ver si en la próxima versión del software permiten meter parámetros de varias líneas, sería muy útil para crear plantillas en el sentido antiguo (es decir, no del software, sino de las de copiar/pegar/ir rellenando huecos), y eso vendría bien allí. Por otro lado, las plantillas para poner "español, verbo transitivo..." no sé si harían falta. Se trata de hacer un diccionario wiki, no de papel, y todo eso por fuerza van a ser categorías, así que pienso que sería más práctico crear categorías "español", "verbo transitivo", etc., y simplemente agregar el artículo. Si un artículo está en las categorías "francés" y "nombre común", está claro que la palabra de la que se habla es un nombre común en francés, ¿no? Si el sistema se extendiese a otros Wikcionarios, podría incluso hacerse un bot que creara los artículos, copiando el artículo equivalente, y buscando las categorías equivalentes (mirando el interwiki de destino en la página de la categoría). --Comae 04:09 17 ago, 2004 (CEST)


Me alegra mucho que la idea haya tenido buena acogida. Con respecto a la wiki holandesa no quise decir que sea necesaria una "traducción" en el sentido literal de la palabra. De hecho hasta donde pude ver, las usan sólo para dar formato a los niveles y no usan parámetros, aunque quizás no haya ahondado suficiente en el tema. Preferiría que la tomemos como referencia y desarrollemos las plantillas según las necesidades y convenciones de nuestra lengua:

  • Plantillas de generación de contenidos: verbos, plurales, superlativos
  • Plantillas de formato: Modelos estándar para niveles, entradas de etimología, pronunciación, etc.
  • Plantillas de navegación: para enlazar familias de palabras, preposiciones, adverbios, etc.

Por cierto, para los que quieran ir curioseando el trabajo de nuestros colegas, la palabra holandesa para plantilla es "sjabloon"

La parte que veo más dificil es la de una generación de contenidos basado en las complejas reglas de nuestro idioma. Pero tengo esperanzas de que podamos sistematizar lo suficiente el asunto. Para quien le interese, podemos basarnos en el excelente trabajo que hicieron Jesús Carretero y Santiago Rodríguez, que se adaptó para convertirse en el corrector ortográfico de OpenOffice.

El corrector actualmente trabaja con dos archivos:

es_ES.dic tiene un formato palabra base/MODIFICADORES

 aarónico/PS
 ababillar/PRSVWX
 abacería/S
 abacero/PS
 ábaco/S
 abadejo/PS
 abadengo/PS
 abadernar/PSVX
 abadesa/S
 ...

es_ES.aff tiene un formato TIPO CODIGOMODIFICADOR sacar poner condición

 SFX S 0 s [aeiouáéó]
 SFX S 0 es [úídjlry]
 SFX S z ces z
 SFX S 0 es [^é]s
 SFX S 0 es [^áéíóú]n
 SFX S án anes án
 SFX S én enes én
 SFX S ín ines ín
 SFX S ón ones ón
 SFX S ún unes ún
 SFX S és eses és
 SFX P e a e
 SFX P o a o
 SFX P 0 s [eo]
 SFX P o as o
 SFX P e as e
 SFX P án ana án
 SFX P án anes án
 SFX P án anas án
 SFX P ín ina ín
 SFX P ín ines ín
 SFX P ín inas ín
 SFX P ón ona ón
 SFX P ón ones ón
 SFX P ón onas ón
 SFX P 0 a [^aons]
 SFX P 0 es [^aons]
 SFX P 0 as [^aons]
 SFX P és esa és
 SFX P és eses és
 SFX P és esas és
 ...

Hoy por hoy no sé exactamente como vamos a aprovechar este material (cubierto por licencia GPL :)), pero tengo fe en que se nos ocurrirá algo bueno. Y ahora (estoy un poco revoltoso últimamente)...

Me parece una buena idea esto de las conjugaciones, pero yo añadiría algo importante dentro de las plantillas: si es un verbo regular, o si no; En el segundo caso (o incluso en los dos) poner un verbo conocido como modelo. Así lo hacen en todos los diccionarios y aunque nosotros no tenemos problemas de espacio (mientras no se haga una edición en papel que todo hay que preverlo) no es buena idea poner toda la conjugación y dejar al lector la labor de inferir cómo se conjuga el verbo, si es regular, si no y cómo qué verbo que ella/él ya conozca se conjuga. ManuelGR 20:52 26 ago, 2004 (CEST)

Estoy de acuerdo con Manuel GR. Respecto a las conjugaciones irregulares, he empezado a estudiar el asunto y creo que va a ser bastante sencillo aplicar las plantillas a los verbos irregulares españoles. Si miráis la «Gramática didáctica del español» de Seco o la «Gramática de la RAE», veréis que es relativamente fácil categorizar los verbos irregulares por grupos, y en la mayoría de los casos las irregularidades siguen unos patrones sistemáticos que posibilitan el tratamiento por plantillas. Seco reduce el número de conjugaciones a 54. Si alguien quiere trabajar esto también que me lo comente, porque, de momento, he empezado a desarrollar listados de verbos irregulares por mi cuenta, no en la Wiki. Ya los iré trayendo. --Javier Carro 16:15 4 sep, 2004 (CEST)

Vaya! Sobre gustos no hay nada escrito... Es cierto que en ningún diccionario de papel aparerecen todos los verbos conjugados en todas sus formas. Y aquí, más que nunca se podría asegurar eso de que "Wikipedia no es de papel". Aunque pienso verla en papel algún día :).

En cuanto a lo que más le conviene al usuario, supongo que habrá para todos los gustos... Les comento mi experiencia personal: al principio me parecía un poco redundante ver lo parecido de las conjugaciones amar vs cantar, con lo cual podría apoyar que cantar tenga sólo un enlace a amar. Pero si veo las conjugaciones en portugués, catalán y asturiano (en las que me cuesta incluso ubicar la raíz) agradezco que toda la conjugación esté ahí y no tenga que hacer el esfuerzo de pensar. Creo que podría aprender otro idioma un poco más rápido si dispusiera de una herramienta así. Lo mismo me gustaría ofrecerle a alguien que está aprendiendo castellano.

Pero también tenemos al usuario que no le interesa toooda la conjugación, o quiere hacer el ejercicio de desarrollar la conjugación basado en un verbo modelo. Es más, visto de ese modo, habrá gente a la que no le interesa la pronunciación (y otra que sí)... gente a la que le interesa la etimología (y otra a la que no)... etc.

Todo esto me recuerda una máxima de los sitios web mejor diseñados: "Dejad que el usuario decida". Creo que no tenemos que pedirle nada extraordinario al software. Hoy, con CSS podríamos ocultar secciones que al usuario no le interesen, como por ejemplo la conjugación completa. De hecho se pueden definir estilos distintos para visualización en pantalla y para impresión. Para preparar una impresión profesional del wikcionario, podríamos decidir editando estos estilos, si queremos un diccionario simple, uno con traducciones, con/sin etimología, con/sin ejemplos de frases. Por supuesto, debería probar todo lo que estoy diciendo aquí... así que podría intentarlo con estas tablas de conjugaciones. ¿Qué les parece? --Pybalo 10:58 7 sep, 2004 (CEST)

Reporte de errores[editar]

  1. A la vista de algunas páginas en meta que comentan los límites de las categorías, opino que no se deberían incluir en las plantillas categorías tan generales como "sustantivos" o "verbos regulares" y menos aún "palabras en idiomaX" como se lee actualmente en varios Wikcionarios, o las debería tener con fines de testeo, unicamente.
  1. Luego de ver algunas páginas de meta, he decidido abandonar el uso de algunos caracteres especiales que he estado usando, como el * (asterisco), ya que nos pueden traer serios problemas en el futuro. Tendré que tocar bastante! --Pybalo 17:36 12 sep, 2004 (UTC)