Acceso léxico: variables y
modelos. Una primera
aproximación
Escritos de la profesora
Introducción
El estudio de la psicología del lenguaje dedica muchos de sus esfuerzos al estudio del procesamiento de la
palabra. La palabra se considera la unidad mínima de lenguaje dotada con significado, aunque el fonema es
la unidad de lenguaje más pequeña que permite diferenciar significados. En este sentido, la palabra es la
unidad mínima de lenguaje con significado, pero el fonema es la unidad mínima de lenguaje significativa.
Aunque, en sentido estricto, es el morfema lo que constituye la unidad de lenguaje mínima con significado.
Esta idea la retomaremos más adelante en el texto, pero, por ahora, para poder estudiar el acceso léxico,
también llamado reconocimiento de palabras, tomaremos como referencia la palabra.
¿Qué es el acceso léxico y por qué lo estudiamos? El acceso léxico es el proceso mediante el cual el sistema
de lenguaje “encuentra” una palabra (tanto la palabra hablada como la palabra escrita). Es importante
estudiar este proceso, pues este proceso está en la base de muchas de las acciones posteriores: la
comprensión del significado, la identificación de los elementos en la oración y, en última instancia, la
comunicación efectiva. Reconocer las palabras y acceder a su significado es la acción mínima que se
requiere para poder comprender el lenguaje. De hecho, muchas de las dificultades que existen en el lenguaje
vienen por alteraciones en el acceso léxico y en el reconocimiento de la palabra o de sus partes.
1
El reconocimiento de la palabra
El reconocimiento de palabras (o acceso léxico) es un acto lingüístico que requiere de la participación de
procesos cognitivos que subyacen a él. Se considera un proceso que sucede en la mente, tanto en la memoria
a largo plazo como en la de trabajo.
Reconocer una palabra significa que se activan estructuras representadas en la memoria y es precisamente la
identificación de palabras el primer paso para la comprensión del lenguaje. Esta identificación sucede por la
simultaneidad de tres procesos que trabajan tres tipos de información: la información estimular (fonemas,
ortografía…), la información léxica (sílabas, morfemas…) y la información contextual (significados). En
este sentido, el reconocimiento de una palabra sucede en tres fases: el reconocimiento de fonemas, la
selección de morfemas y la identificación del significado. Estas fases se relacionan con una serie de
representaciones que se forman en la mente cuando tratamos de reconocer una palabra. Las representaciones
de las que hablamos son: la representación fonológica, la representación ortográfica, la representación
morfológica y la representación sintáctica.
Cuando hacemos el procesamiento de la información fonológica lo que estamos haciendo es acceder a los
sonidos del habla. Con el procesamiento fonológico lo que hacemos es identificar las letras y su posición. En
la representación morfológica se asigna la función gramatical de la pieza léxica dentro de la cadena hablada
o texto. Y la representación sintáctica permite asignar el patrón de empleo contextual, es decir, el orden
dentro del texto. En términos prácticos, ya con la representación ortográfica el sujeto puede discernir si la
palabra corresponde a la lengua propia, y le permite la discriminación entre palabras y pseudopalabras. ¿Qué
son las pseudopalabras? Una pseudopalabra es una agrupación de letras que, aunque parezca una palabra
real, ya que puede pronunciarse y presenta caracteres de uso habitual en la lengua, no lo es. Algunos
ejemplos pueden ser “bomderos”, “paperela”, “espimacias”, “pelícono” o “raciador”. Son palabras carentes
de representación semántica, es decir, sin significado. Al leerlas, no viene ninguna idea o concepto a la
2
mente. Las pseudopalabras son un buen mecanismo para trabajar la comprensión lectora con alumnos con
necesidades específicas de apoyo educativo.
¿Cómo conocemos sobre todos estos procesos de representación e identificación léxica? Algunas de las
tareas experimentales más utilizadas en la Psicología del Lenguaje incluyen: la tarea de decisión léxica,
tareas de denominación (Naming task), tareas de priming, etc.
Técnicas experimentales para explorar los procesos de acceso
léxico o reconocimiento de palabras
Gating (o apertura sucesiva). En esta tarea, un estímulo lingüístico (habitualmente, una palabra) se va
presentando a través de sucesivos segmentos de duración creciente, hasta que puede ser identificado.
Generalmente, los segmentos se inician desde el principio del estímulo. El primer segmento normalmente es
muy corto (20-30 ms), y el último abarca ya el estímulo entero. En esta tarea interesa saber, sobre todo, el
punto en el que la palabra es reconocida (el Punto de Unicidad).
Decisión léxica. Se trata de una de las tareas más usadas en la psicolingüística, tanto en la modalidad
auditiva como en la visual. Se presentan series de letras ortográficamente legales sobre la pantalla del
ordenador, y los participantes tienen que responder, pulsando uno de dos botones, dependiendo de si se trata
de una palabra real (p. ej., plato) o no (p. ej., plota). En este caso se mide el tiempo de reacción o latencia [en
milisegundos] (RAPIDEZ). Aunque también puede interesar registrar los aciertos (PRECISIÓN). Se
entiende que aquí el participante accede y busca velozmente en su «diccionario» mental y, si encuentra una
unidad léxica, responde con la tecla «sí». Si busca y «agota» el diccionario sin encontrar una unidad léxica,
termina respondiendo «no».
Naming task (tareas de denominación) o lectura en voz alta de palabras. La denominación es la
capacidad que tenemos de referirnos a un objeto, persona, lugar, concepto o entidad por su nombre. Para
denominar un objeto necesitamos “acudir” al almacén léxico de nuestro cerebro, encontrar la palabra
3
concreta que estamos buscando y producirla. Las tareas de naming (o denominación) consisten en nombrar /
leer el conjunto de letras que aparecen en una palabra y que habitualmente constituyen una palabra, aunque
puede ser una pseudopalabra. La variable dependiente que medimos en este caso es el tiempo de reacción
(que también llamamos latencia) o el número de aciertos.
Principales variables que influyen en el reconocimiento de
palabras
En psicolingüística, una de las variables más importantes es la frecuencia de uso (o frecuencia léxica), es
decir, la frecuencia con que se utiliza cada palabra. Cuanto mayor es la frecuencia de uso, más fácil resulta
su procesamiento: tardamos menos en comprender las palabras de alta frecuencia y también tardamos menos
en recuperarlas cuando hablamos.
La variable frecuencia léxica tiende a relacionarse con otras variables, como el grado de concreción (o
imaginabilidad), longitud de la palabra, etc. Todas estas variables afectan a los procesos de acceso léxico.
Una de estas variables es la edad de adquisición, que se refiere la edad a la que se aprende cada palabra a lo
largo de la vida.
Algunas palabras son conocidas por los niños durante los primeros años de su vida, otras las aprenden
cuando empiezan la escolaridad y otras no las aprenden hasta edades bastante tardías. Numerosos
experimentos han mostrado que la edad de adquisición es una variable muy determinante del reconocimiento
de las palabras, hasta el punto de que algunos autores sostienen que es incluso más importante que la
frecuencia de uso, puesto que muchos de los efectos que se habían atribuido a la frecuencia en realidad
corresponden a la edad de adquisición. En efecto, frecuencia y edad de adquisición son variables muy
relacionadas, dado que normalmente las palabras que los niños aprenden antes son las más frecuentes y las
que aprenden a una edad tardía son palabras de baja frecuencia.
4
Un problema de la variable edad de adquisición es que es más difícil de cuantificar que la frecuencia. Si para
la frecuencia basta con tomar un buen número de textos y, con un programa informático, contar las veces
que aparece cada palabra, con la edad de adquisición la tarea de saber en qué momento aprenden por lo
general los niños cada palabra es realmente complicada.
Otra variable influyente en el reconocimiento de la palabra es la vecindad fonológica. Se consideran
vecinos fonológicos de una palabra todas aquellas que comparten todos los fonemas, excepto uno, y en las
mismas posiciones. Así, las palabras «topo», «tino», «tomo», «tuno» y -toro» son vecinas de «tono». Hay
palabras con muchos vecinos, podría decirse que habitan en vecindarios muy densos o populosos; por
ejemplo, «casa» tiene como vecinos a «masa», «pasa», tasa», «gasa», «cosa», «capa», «cama», «cava», -
cana», etc. En el otro extremo están las palabras ermitañas, que no tienen vecinos, como «tifus».
La mayoría de los estudios encuentran que la vecindad fonológica tiene efectos inhibitorios en el
reconocimiento de palabras habladas, ya que, cuantos más vecinos tiene una palabra, más se tarda en
reconocerla.
Diversas investigaciones en inglés y otros idiomas, han encontrado el llamado efecto de longitud de la
palabra, con una latencia de reconocimiento menor en palabras cortas que largas.
Por último, hay además otras variables que, aunque menos influyentes que las anteriores, también tienen
efectos sobre los tiempos de reconocimiento. La variable imaginabilidad se refiere a la facilidad con que
uno puede imaginar el significado de una palabra. Hay palabras fáciles de imaginar, como «cuchillo»,
«gato» o «libro», y otras en la que es muy difícil producir una imagen, como «verdad», «ética» o «maldad».
Se ha demostrado que las palabras concretas y altamente imaginables se recuerdan mejor que las abstractas y
difícilmente imaginables en las pruebas de memoria. Las palabras concretas producen mejores tiempos en la
tarea de decisión léxica, sobre todo en las palabras de baja frecuencia léxica.
Estas variables afectan a la velocidad de acceso a la palabra, así como a la precisión a la hora de
identificarla. Algunos de los fenómenos empíricos conocidos en el acceso léxico son:
5
1. Efecto de la frecuencia léxica. Las palabras de alta frecuencia tienen tiempos de procesamiento más
rápidos (latencias más bajas) que las palabras de baja frecuencia.
2. Efecto priming. Este efecto hace referencia a la influencia que tiene un estímulo en el rendimiento
subsiguiente del sistema de procesamiento. En el contexto del procesamiento del lenguaje, el priming
se da cuando el tiempo de lectura de una palabra se reduce en una segunda vuelta cuando de nuevo
leemos esa misma palabra. A esto lo llamamos priming de repetición. Existe también un segundo
priming, al que llamamos priming semántico. Este efecto se produce cuando las palabras en las que
se da el priming están relacionadas semánticamente. Por ejemplo, «cocina» y «frigorífico». Con ello,
el tiempo de lectura de la segunda palabra («frigorífico») se reduce porque hemos accedido con
anterioridad a otra palabra relacionada («cocina»).
Modelos de acceso léxico
Los modelos de acceso léxico explican la forma cómo el cerebro procesa los estímulos visuales o auditivos y
reconoce las palabras. En una primera clasificación, se encuentran modelos de carácter directo y modelos de
carácter indirecto; y modelos seriales y modelos interactivos o paralelos.
Los modelos explican el procesamiento a partir de diferentes enfoques. No obstante las discrepancias, es
posible apreciar cierto consenso en distinguir las siguientes etapas en el proceso de reconocimiento léxico:
A. Contacto léxico inicial: llegada del input sensorial, ya sea en el plano auditivo como el ortográfico.
B. Activación: ese input sensorial gatilla la excitación o la inhibición de aquellas entradas con las que
el estímulo comparta características, que constituyen los candidatos a posible selección.
C. Selección: abandono de los candidatos menos adecuados, a través de la activación diferencial.
D. Reconocimiento: culminación de los pasos anteriores. Momento en el que la palabra seleccionada se
aprueba sin duda ni error.
6
E. Acceso al léxico: momento en que quedan disponibles las características léxicas no activadas
previamente. Cuando tenemos estas características léxicas es cuando podemos acceder a la
información semántica.
Modelo de Logogén (Morton, 1969, 1982)
Uno de los modelos más influyentes en el acceso léxico es el Modelo
de Logogén. Se trata de un modelo interactivo y directo. En los años
setenta, John Morton planteó un modelo sobre el reconocimiento de
las palabras en el que cada palabra estaría representada en la memoria por un dispositivo denominado
logogén. Los logogenes equivalen a recipientes o casillas que reciben información estimular (información
fonológica, ortográfica…). Conforme reciben esta información, se van llenando hasta llegar a un punto de
umbral en la que es suficiente para activar el logogén. Entonces, se produce el reconocimiento de la palabra.
Esa “activación” del logogén constituye la identificación de la palabra. Los logogenes compiten entre sí en
la identificación de las palabras y, mientras no están activos, mantienen un cierto nivel de activación basal o
de reposo.
7
Este modelo interactivo explica la mayor parte de los fenómenos empíricos conocidos en el acceso léxico:
Priming de repetición. El priming de repetición hace referencia a la influencia que tiene un estímulo en el
rendimiento subsiguiente del sistema de procesamiento. En el contexto del procesamiento del lenguaje, el
priming se da cuando el tiempo de lectura de una palabra se
reduce en una segunda vuelta cuando de nuevo leemos esa
misma palabra. El modelo de Logogén explica este efecto de la
siguiente forma: después de que un logogén ha sido activado al
identificar una palabra, su activación desciende al nivel de
reposo, pero esto no ocurre de forma instantánea, sino que lleva
cierto tiempo. Las palabras recién activadas retendrán una
activación residual superior a la de reposo durante un corto
período de tiempo y esto hace que cuando tengamos que volver a
reconocerlas, se requiera menos información estimular para ello.
Efecto del priming semántico. Los logogenes están conectados
entre sí de manera que se comunican la activación, y ésta se
extiende entre los logogenes cercanos.
Efecto de la frecuencia léxica. Cada logogén tiene un umbral de disparo distinto. Las palabras de alta
frecuencia, que son familiares al sistema de logogenes porque se han presentado muchas veces a lo largo de
la vida del sujeto, cuentan con logogenes con un umbral más bajo, activándose antes que las palabras poco
frecuentes, que tienen umbrales más altos y necesitan mayor cantidad de activación antes de alcanzarlo.
Modelo de búsqueda serial: Modelo de Foster (1976, 1979)
8
Al contrario que el modelo de Logogén, los modelos de búsqueda serial conciben el acceso léxico como
mecanismos semejantes al de identificar una palabra en un diccionario. El sistema se organiza a través de
entradas léxicas, que están ordenadas para facilitar la búsqueda.
Cuando una palabra se presenta visual o
auditivamente, el estímulo de entrada es
convertido en una representación perceptiva y
enviada al archivo de acceso apropiado para
su análisis. Estos ficheros proporcionan
punteros o indicadores dirigidos al fichero
maestro que almacena toda la información del
léxico mental, incluidos los significados. Para
acelerar el proceso de búsqueda, los ficheros de acceso están divididos en compartimentos (bins) separados,
probablemente sobre la base de la primera sílaba o las primeras letras de las palabras. Dentro de cada bin,
los ítems están ordenados por la frecuencia de uso, con las unidades más frecuentes al principio, de manera
que éstas son localizadas más rápidamente que las menos frecuentes. Se explica así el efecto de la frecuencia
de las palabras en la velocidad de reconocimiento.
Una diferencia principal entre el modelo de Logogén y el modelo de búsqueda serial de Foster es que,
siendo el segundo serial, el primero es paralelo o de acceso directo. El procesamiento en serie implica el acto
de atender y procesar un elemento a la vez, mientras que el procesamiento paralelo es el acto de atender y
procesar todos los elementos simultáneamente. Un modelo serial postula una secuencia ordenada de etapas
que se activan sucesivamente, mientras que un modelo de tipo directo o paralelo postula una activación de
etapas paralela y simultánea.
9
Modelo de cohorte Marslen-Wilson (1973, 1975, 1987)
El modelo de cohorte supone una solución mixta entre
los modelos de acceso directo y los de búsqueda serial.
Lo es en la medida en que postula una secuencia
ordenada de etapas, pero en ellas se activan paralela y
simultáneamente varios elementos léxicos. Se trata de un
modelo concebido únicamente para las palabras
habladas.
El modelo plantea lo siguiente: mientras una persona
está escuchando una palabra (p. ej., «elefante»), desde el
principio se activan en paralelo un conjunto finito, o
«cohorte», de palabras congruentes con los sonidos
iniciales, y todas ellas serían inicialmente candidatos léxicos del estímulo. Son representaciones que
compiten en el proceso de identificación. Así, al oír la vocal inicial de «elefante» se activarían palabras que
empiezan por esa vocal, como «estudio», «ecuador», «elegido», «elefante», etc. A medida que el estímulo
va ingresando en el sistema perceptivo, la cohorte inicial se reduce y se van desactivando los candidatos
incompatibles con la secuencia de sonidos. Al final sólo queda activo el único candidato coherente
(«elefante») con esa particular secuencia acústica. El modelo plantea que cada palabra tiene un punto de
unicidad, o punto óptimo de reconocimiento, a partir del cual la palabra queda como candidato único y es
reconocida sin esperar al final (p. ej., «elefante» tendría su punto de unicidad después de la secuencia
«elef»).
Los resultados sugirieron a Marslen-Wilson que la percepción de una palabra se basa en un continuo
estrechamiento del abanico de candidatos posibles hasta alcanzar el punto de unicidad, momento en que se
produciría la identificación léxica. Ese punto es diferente para cada palabra, dado que depende de los otros
10
candidatos. Aquí, la información del contexto puede influir acelerando el proceso mediante la eliminación
de competidores de la cohorte que son poco congruentes con ese contexto.
Modelos conexionistas: TRACE (McClelland & Elman, 1986)
Durante la década de los ochenta surgieron con fuerza los modelos conexionistas. TRACE es un modelo
altamente interactivo propuesto por McClelland y Elman (1986) para el reconocimiento de las palabras
habladas.
Se trata de un modelo conexionista formado por
múltiples unidades simples conectadas entre sí. Estas
unidades están organizadas en tres niveles de
procesamiento. En la parte inferior, un primer nivel
correspondiente a las unidades de entrada se encarga de
analizar el input, o estímulo entrante, en sus rasgos
fonológicos elementales, como sonidos sordos, sonoros,
difusos, agudos, etc. Este nivel está conectado con el
siguiente, que representa a los fonemas. Finalmente, el nivel de los fonemas se conecta con el nivel superior
correspondiente a las palabras. En este esquema general, la información fluye desde abajo hacia arriba, pero,
al mismo tiempo, los niveles superiores influyen sobre los inferiores, facilitándoles la tarea. Precisamente, la
característica más importante de TRACE es que concede gran importancia a los procesos de arriba-abajo
(top-down), de manera que el nivel de las palabras actúa sobre el nivel de los fonemas, y éste sobre el de los
rasgos fonológicos. Al mismo tiempo, junto a este procesamiento de abajo-arriba, se da, como se ha
señalado, un procesamiento inverso de arriba-abajo (bottom-up) que ayuda a que resulten ganadoras las
unidades coherentes con las representaciones superiores.
11
El modelo TRACE ha sido y es muy influyente para toda una generación de nuevos modelos de corte
interactivo y conexionista. Una de sus ventajas consiste en que puede ser imple-mentado matemáticamente
en computadores para llevar a cabo simulaciones cuyos resultados pueden contrastarse con los obtenidos
experimentalmente en seres humanos.
La organización del léxico mental
Una última pregunta, ¿Nuestra biblioteca de palabras, almacén léxico o simplemente léxico, contiene
palabras o partes de palabras? Es decir, ¿las palabras se almacenan enteras o por partes? Si almacenamos las
palabras enteras, entonces deberíamos tener una ‘entrada’ para cada versión de la misma palabra: encender,
encendedor, encendía, enciende, encenderá, encendería, encendido, …
Al tratar la organización del léxico mental, se han propuesto dos hipótesis alternativas sobre el
reconocimiento de las palabras morfológicamente complejas. La hipótesis del listado exhaustivo sostiene
que cada palabra compuesta tiene su propia representación léxica independiente. La hipótesis de la
segmentación obligatoria, en cambio, mantiene que las palabras son segmentadas en sus morfemas
componentes, por lo que se accede a la raíz (lexema) y a los afijos (morfemas derivativos y flexivos) de
manera independiente.
Actualmente, la hipótesis más defendida es una versión híbrida de los dos anteriores: el modelo mixto o
dual que asume ambas posibilidades de procesamiento. Las palabras de morfología irregular y las palabras
frecuentes cuentan con su propia representación léxica, por lo que se reconocen directamente, y las palabras
regulares y de baja frecuencia se descomponen en raíz y afijos.
Por lo tanto, no todas las palabras se procesan igual. Los tiempos de reacción pueden variar mucho en
función de la frecuencia, la irregularidad, la imaginabilidad y otras variables. Puede influir también en el
procesamiento de las palabras, su contenido emocional. Un caso particular relacionado con el contenido
12
emocional de las palabras lo constituyen las denominadas palabras tabú. Parece que las palabras tabú
«absorben recursos de procesamiento». Algunos estudios reportan que, en general, los tiempos de reacción
son más rápidos para las palabras con alta carga en determinadas dimensiones emocionales. Desde hace
tiempo se sabe que las palabras tabú no se procesan igual que las otras palabras y que se recuerdan mejor en
pruebas de memoria y, además, deterioran el recuerdo de la palabra precedente y posterior dentro de una
lista.
En definitiva, sorprende la rapidez y eficacia con que comprendemos las palabras, si tenemos en cuenta que
cuando oímos unos sonidos, en sólo cuestión de milisegundos reconocemos de qué palabra se trata de entre
las decenas de miles que forman nuestro léxico mental.
A través de las diferentes metodologías conductuales que hemos visto a lo largo de este texto,
principalmente las basadas en los tiempos de reacción, podemos inferir cómo están organizadas las palabras
en nuestra memoria y qué variables determinan la rapidez con que las reconocemos. Basándose en estos
resultados se han propuesto varios modelos sobre la forma en que están organizadas las palabras en el léxico
y las operaciones que realizamos durante su reconocimiento.
Referencias
Armas Betancort, A. (2017). La influencia de la longitud de la palabra en el recuerdo de palabras
visualmente presentadas.
Bargetto Fernández, M. Á., & Riffo Ocares, B. (2019). El reconocimiento de palabras y el acceso léxico:
revisión de modelos y pruebas experimentales. Boletín de filología, 54(1), 341-361.
Cuetos, F., & Vega, F. C. (2010). Psicología de la lectura. Wk Educación.
Fernández, M. A., & Cuetos, F. (2006). Efectos de las variables léxico-semánticas en el reconocimiento
visual de palabras. Psicothema, 18(3), 485-491.
13