A B C D E F G H I J K L É X I C O Q R S T U V W X Y Z A B Á S I C O H I J K L M N Ñ O P Q R S T U V W X Y Z A B C D E L G E S P A Ñ O L Ñ O P Q R S T U V W X Y Z A B C D E F C H I L E L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z
LÉXICO BÁSICO DEL ESPAÑOL DE CHILE A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z Q R S T U V W X Y Z A B C D E F G H I J K L É X I C O L M N Ñ O P Q R S T U V W X Y Z A B Á S I C O H I J K P Q R S T U V W X Y Z A B C D E L G E S P A Ñ O L Ñ Q Ñ O P Q R S T U V W X Y Z A B C D E F C H I L E L M N A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z
M A R Í A N ATA L I A C A S T I L LO FA D I Ć A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L É X I C O Q B Á S I C O X Y Z A B C D E F D E L J E S P A Ñ O L Q R S T U V W X Y Z A B C D E F C H I L E L M N Ñ O P Q R S T U V W X Y Z A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z PRÓLOGO DE HUMBERTO LÓPEZ MORALES
LÉXICO BÁSICO DEL ESPAÑOL DE CHILE M A R Í A N ATA L I A C A S T I L LO FA D I Ć PRÓLOGO DE HUMBERTO LÓPEZ MORALES
ÍNDICE
Agradecimientos
9
Prólogo
11
Exordio
13
§ 1 Información básica: para comprender y usar este diccionario 1.1. Símbolos y abreviaturas 1.2. Organización del diccionario 1.3. Organización de la información dentro de cada artículo lexicográfico
15 15 16
§ 2 Información para usuarios y educadores
19
§ 3 Aspectos técnicos: del Corpus Básico al Léxico básico del español de Chile 3.1. Políticas lingüísticas: léxico básico y educación 3.2. El Corpus Básico del Español de Chile 3.3. Léxico básico del español de Chile: fundamentos teóricos 3.4. Procesamiento del corpus: lematización y segmentación 3.5. Curvas de cobertura y representatividad del corpus 3.6. Vocablos de mayor uso 3.7. Constitución final del Léxico básico
23 23 26 30 34 36 38 42
§ 4 Referencias bibliográficas
45
§ 5 Fuentes
47
Léxico básico del español de Chile: el diccionario
17
105
| 15
§1 INFORMACIÓN BÁSICA: PARA COMPRENDER Y USAR ESTE DICCIONARIO
El Léxico básico del español de Chile es un diccionario que contiene los 4.831 vocablos de mayor uso en el español chileno actual. Ha sido construido a partir de diversos muestreos sobre un corpus de más de 500.000 palabras extraídas de fuentes escritas de primera mano —seleccionadas sin sesgo ético ni estético— publicadas en un período de veintiséis años entre los siglos XX y XXI. Por su tipología y naturaleza, este diccionario no incluye definiciones. Las unidades léxicas —monoverbales y pluriverbales— se organizan de acuerdo con el orden alfabético internacional y funcionan como lemas de artículos lexicográficos. Para cada uno de ellos se entrega información gramatical y estadística y se da cuenta de los tipos o variantes a través de los cuales aparece efectivamente realizado el vocablo en el corpus. En el caso de los verbos, se incluyen las conjugaciones, las realizaciones voseantes, los tiempos compuestos, la voz pasiva y los adjetivos participiales, aun cuando estén en diminutivo. En el caso de sustantivos y adjetivos, se consignan los diminutivos y aumentativos que no implican cambio semántico. Por economía, si un vocablo solo incluye un tipo y este coincide con el lema, no se repite el tipo bajo el vocablo. Para facilitar el uso del diccionario, se aplican marcas gramaticales simplificadas, basadas en la gramática tradicional.
1.1. SÍMBOLOS Y ABREVIATURAS 1 2 3 ADJ CAL
primera persona segunda persona tercera persona adjetivo calificativo
16 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE
ADJ DEM ADJ EXCL ADJ IND ADJ INT ADJ NUM ADJ POS ART DEF ART IND ADV CONJ COORD CONJ SUB I i PREP PRON PRON DEM PRON EXCL PRON IND PRON INT PRON PERS PRON POS PRON REL SUST V V AUX V SEMI AUX
adjetivo demostrativo adjetivo exclamativo adjetivo indefinido adjetivo interrogativo adjetivo numeral adjetivo posesivo artículo definido artículo indefinido adverbio general conjunción coordinada conjunción subordinada interjección modo imperativo preposición pronombre pronombre demostrativo pronombre exclamativo pronombre indefinido pronombre interrogativo pronombre personal pronombre posesivo pronombre relativo sustantivo común verbo verbo auxiliar verbo semiauxiliar
1.2. ORGANIZACIÓN DEL DICCIONARIO Los vocablos están ordenados de acuerdo con el orden alfabético internacional; es decir, dígrafos como ch o ll aparecen bajo C en el caso de ch y bajo L en el caso de ll. Esto permite buscar fácilmente una unidad léxica, para saber si forma parte del léxico básico y, en caso de que forme parte, conocer sus índices estadísticos. En la sección 3.6, además, destacamos los cien vocablos de mayor uso en el español de Chile, ordenados por rango de uso, de mayor a menor. Esto pretende facilitar la tarea de los educadores que, si lo desean, podrán programar
36 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE
3.5. CURVAS DE COBERTURA Y REPRESENTATIVIDAD DEL CORPUS Nuestro corpus presenta una curva de cobertura similar al de Morales (1986), con fuentes escritas como las nuestras, pero disímil respecto del de Ávila (1998), con fuentes orales. Esto confirma lo señalado por Ávila (1998, pág. 257) respecto de que la cobertura se alcanza con mayor rapidez en corpus formados por textos orales, lo que se ratifica también al observar en nuestro corpus que la mayor velocidad sostenida de cobertura se logra en Drama, donde las oraciones que conforman el corpus de referencia corresponden a parlamentos pensados para ser emitidos oralmente por actores, emulando intercambios orales en presentaciones frente a público.
Vocablos
Drama
Narrativa
Ensayo
TécnicoCientífico
Prensa
Primeros 50
52,45317%
50,36652%
50,15457%
50,38526%
49,86673%
Primeros 100
60,64938%
56,28222%
55,33256%
55,39573%
54,38839%
Primeros 500
77,15970%
71,24919%
71,37668%
71,69272%
68,61179%
Primeros 1.000
83,27389%
78,02884%
79,32885%
79,94999%
76,20969%
Primeros 2.000
88,94250%
84,72088%
86,70557%
87,71627%
83,89819%
Primeros 3.000
91,96663%
88,44248%
90,52453%
91,54045%
87,91943%
Primeros 4.000
93,96473%
90,90644%
92,88141%
93,83170%
90,46049%
Primeros 5.000
95,31845%
92,92029%
94,69753%
95,43274%
92,56750%
Primeros 6.000
96,31750%
94,12961%
95,71783%
96,44927%
93,64103%
Figura 4. Cobertura del corpus
En efecto, al comparar las curvas de cobertura por mundo (Figuras 4 y 5). Drama alcanza una cobertura superior al 60% en el rango 100, mientras los demás se encuentran alrededor del 55% en promedio, con Prensa en último lugar. Mientras Drama sube del 80% en el rango 1.000, seguido de cerca por TécnicoCientífico, los demás se mantienen por debajo de esta cifra. Drama, Ensayo y Técnico-Científico llegan al 90% de cobertura antes del rango 3.000, mientras Prensa y Narrativa lo logran alrededor del rango 4.000.
3. Aspectos técnicos: del corpus básico al léxico básico del español de Chile | 37
La menor velocidad de cobertura se observa de manera sostenida en Prensa. Narrativa presenta una cobertura inicial levemente mayor que la de los demás mundos hasta el rango 100, donde ralentiza su avance, situándose en el rango 6000 solo medio punto sobre Prensa. 100,00
90,00
80,00
70,00
60,00
50,00
40,00 0
1.000 Drama
2.000 Narrativo
3.000 Ensayo
4.000
5.000
Técnico-Científico
6.000 Prensa
Figura 5. Curva de cobertura por mundo.
Ensayo y Técnico-Científico presentan curvas similares de cobertura, aunque este último mundo alcanza la cobertura más tempranamente y se distancia progresivamente del primero a partir del rango 1000, para alcanzar máxima cobertura sobre el 6000, ubicándose por encima de Drama. En todos los casos, y como sucede en investigaciones similares (cf. por ejemplo Ávila 1999, pág. 93), la curva presenta su mayor ascenso en los primeros deciles, mostrando luego un crecimiento progresivamente menor, que tiende a estabilizarse en el tercer segmento —500 primeras palabras— en el caso de Drama, por su cercanía con la oralidad, y en el cuarto —1.000 primeras palabras— en los demás.
38 | LÉXICO BÁSICO DEL ESPAÑOL DE CHILE
3.6. VOCABLOS DE MAYOR USO A continuación presentamos los cien vocablos de mayor uso, ordenados según este índice de mayor a menor (cf. Figura 6). Rango
Lema
Categoría
Frecuencia
Dispersión
Uso
1
el
art
57215
0,91
52065,65
2
de
prep
33182
0,88
29200,16
3
y
conj coord
14269
0,95
13608.35
4
a
prep
12510
0,95
11884,5
5
en
prep
12844
0,89
11431,16
6
un
art def
10128
0,95
9621,6
7
que
pron rel
9676
0,97
9385,72
8
ser
v semi aux
7125
0,87
6198,75
9
que
conj sub
6901
0,84
5796,84
10
se
pron
6114
0,94
5747,16
11
su
adj pos
5464
0,89
4862,96
12
por
prep
4735
0,95
4498,25
13
con
prep
4380
0,91
3985,8
14
no
adv
5733
0,68
3898,44
15
para
prep
3496
0,95
3321,2
16
como
conj sub
2829
0,92
2602,68
17
este
adj dem
2559
0,83
2123,97
18
más
adv
2085
0,94
1959,9
19
lo
pron pers
2705
0,72
1947,6
20
estar
v aux
2275
0,74
1683,5
21
tener
v
2176
0,77
1675,52
22
se
pron pers
1652
0,93
1536,36
23
poder
v
1772
0,85
1506,2
24
hacer
v
1777
0,81
1439,37
25
o
conj coord
1705
0,78
1333,51
26
todo
adj ind
1322
0,89
1176,58
27
le
pron pers
1783
0,65
1158,95
28
pero
conj coord
1471
0,74
1088,54
29
ese
adj dem
1256
0,79
992,24
3. Aspectos técnicos: del corpus básico al léxico básico del español de Chile | 39
Rango
Lema
Categoría
Frecuencia
Dispersión
Uso
30
decir
v
1416
0,68
962,88
31
si
conj sub
1232
0,75
924
32
me
pron pers
2786
0,33
919,38
33
él
pron pers
1119
0,78
872,82
34
sin
prep
906
0,9
815,4
35
otro
adj ind
890
0,9
801
36
entre
prep
930
0,85
790,5
37
ir
v
1390
0,52
722,8
38
dar
v
820
0,85
697
39
haber
v
829
0,84
696,36
40
mismo
adj cal
783
0,87
681,21
41
año
sust
833
0,8
666,4
42
deber
v
817
0,81
661,77
43
sobre
prep
765
0,86
657,9
44
nos
pron pers
886
0,74
655,64
45
ver
v
987
0,65
641,55
46
cuando
conj sub
836
0,73
610,28
47
también
adv
672
0,87
584,64
48
este
pron dem
704
0,83
584,32
49
ya
adv
793
0,72
570,96
50
hasta
prep
632
0,9
568,8
51
desde
prep
651
0,87
566,37
52
vez
sust
672
0,81
544,32
53
mi
pron pos
1416
0,38
538,08
54
porque
conj sub
769
0,69
530,61
55
vida
sust
613
0,82
502,66
56
nuevo
adj cal
606
0,81
490,86
57
los
pron pers
612
0,78
477,36
58
alguno
adj ind
518
0,92
476,56
59
nuestro
pron pos
617
0,77
475,09
60
todo
pron ind
677
0,69
467,13
61
primero
adj num
565
0,82
463,3
62
dos
adj num
553
0,83
458,99
63
día
sust
600
0,76
456
| 107
A a PREP
abajo
11884.50 2808 2804 ADV
abandonar V abandona 3 abandona i abandonaba abandonada abandonadas abandonado abandonados abandonamos abandonan abandonando abandonar abandonaré abandonaron abandonas abandonase abandone abandoné abandonéis abandonen abandonó habían abandonado había abandonado han abandonado has abandonado ha abandonado
12510 0.95 2196 2186 2516
21.09 37 0.57 11 18 5 1 2 53.28 74 0.72 22 27 11 4 10 5 0 0 0 0 0 0 0 0 1 0 2 0 0 0 1 1 1 0 0 1 0 0 0 0 3 1 1 0 0 1 1 0 0 0 0 1 0 0 0 1 0 0 1 0 0 4 1 1 1 2 4 7 1 4 0 1 0 0 0 0 1 0 0 1 0 1 0 0 0 0 1 0 0 0 1 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 0 0 1 0 3 2 0 0 2 0 2 0 0 0 0 1 0 0 0 0 2 0 0 0 3 0 0 0 0 0 0 1 0 0
abandono SUST
11.85 15 0.79 2 2 4 5 2
abanico SUST
3.00 4 0.75 1 1 1 0 1 1 0 1 0 1
abanico
abanicos
0
abarcar V
11.68 16 0.73 0 3 4 4 5 0 0 2 2 2 0 1 0 0 0 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 2 1 0
abarca abarcaba abarcaban abarcan abarcando abarcar abarcaron abarcó abarque abatir V abatida abatidas abatido abatió abatir ser abatido
1
0
0
0
4.64 8 0.58 2 4 1 1 0 1 0 0 0 0 0 1 0 0 0 0 1 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0
abiertamente ADV
4.14 6 0.69 0 1 2 1 2
abismo SUST
8.28 12 0.69 2 3 5 1 1 2 3 5 1 0 0 0 0 0 1
abismo abismos abocar V abocada abocado abocados abocando abocar abocara abocará
5.31 9 0.59 0 3 1 1 4 0 0 0 0 1 0 1 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0 1 0 2 0 1 0 0 0 0 0 0 0 1
108 | abogado
abogado SUST abogada abogado abogados abordar V aborda abordaba abordado abordados abordamos abordan abordando abordar abordaré abordó fueron abordados fue abordado han sido abordados ser abordado ser abordados abrazar V abrace abraza abrazaba abrazaban abrazada abrazados abrazamos abrazan abrazando abrazar abrazaron abrazo abrazó había abrazado
32.90 47 0.70 9 8 6 4 20 2 0 0 0 1 7 6 5 2 14 0 2 1 2 5 21.76 34 0.64 0 3 9 8 14 0 0 1 1 1 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 2 0 0 0 0 1 0 2 5 4 4 0 0 1 0 0 0 0 0 0 2 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 1 1 0 0 0 0 0 0 1 13.72 28 0.49 14 11 1 1 1 1 0 0 0 0 3 0 0 0 0 2 0 0 0 0 0 1 0 0 1 1 0 0 0 0 1 2 0 0 0 0 1 0 0 0 0 1 0 0 0 2 1 0 0 0 2 2 1 1 0 0 1 0 0 0 1 0 0 0 0 1 1 0 0 0 0 1 0 0 0
abrir V abierta abiertas abierto abiertos abra i abra 1 abra 3 abran 3 abran i abre 3 abre i abren abres abrí abría abrían abriendo abriera abrieras abrieron abrimos abrió abrir abrirá abrirán abriremos abriría abriste abro era abierto fue abierto había abierto han abierto ha abierto hemos abierto he abierto ser abiertas abrumar V
abrazo SUST abrazo abrazos abril SUST abril abriles
4.30 10 0.43 1 6 0 0 3 0 4 0 0 3 1 2 0 0 0 15.86 26 0.61 0 4 3 7 12 0 4 3 7 11 0 0 0 0 1
abruma abrumada abrumado abrumados abrupto ADJ CAL abrupta abruptas
175.50 234 0.75 72 74 44 13 31 1 4 9 2 4 1 2 0 1 3 2 3 9 4 4 0 1 2 0 1 11 0 0 0 0 2 0 0 0 0 1 0 0 0 1 3 0 0 0 0 2 4 0 0 0 8 10 7 2 4 3 0 0 0 1 5 2 1 0 0 3 1 0 0 0 1 1 0 0 0 2 6 0 2 0 2 2 0 0 1 2 6 3 0 0 2 0 0 0 1 1 0 0 0 0 0 2 0 0 0 1 1 0 0 0 2 9 1 0 2 10 13 10 1 6 0 1 0 0 1 0 1 0 0 0 1 0 0 0 0 0 1 1 0 0 1 0 0 0 0 3 2 0 0 0 0 1 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0 1 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0 1 0 4.24 8 0.53 4 2 2 0 0 1 0 2 0 0 1 0 0 0 0 1 2 0 0 0 1 0 0 0 0 3.40 5 0.68 0 1 2 1 1 0 1 1 0 1 0 0 1 0 0
458 |
V vacaciones SUST
6.50 13 0.50 1 4 1 0 7
vacío ADJ CAL
7.95 15 0.53 4 8 1 0 2 2 2 0 0 0 0 4 0 0 2 2 1 0 0 0 0 1 1 0 0
vacía vacías vacío vacíos vacío SUST vacío vacíos
19.53 31 0.63 12 11 5 3 0 11 11 4 2 0 1 0 1 1 0
válido ADJ CAL válida válidas válido válidos valioso ADJ CAL valiosa valiosas valioso valiosos valle SUST
vago ADJ CAL vaga vagas vago vagos valer V valdría valdrían vale 3 vale i valen valer valga valgan valgo valía valiendo valiera valió validez SUST
3.06 6 0.51 0 2 0 3 1 0 0 0 1 0 0 0 0 0 1 0 1 0 1 0 0 1 0 1 0 59.94 74 0.81 12 10 23 20 9 0 0 1 0 1 0 0 0 1 0 9 3 15 10 3 1 0 0 0 0 0 1 1 1 0 0 1 2 7 0 1 0 1 0 0 0 0 1 0 0 0 1 1 0 0 0 3 0 1 1 0 1 0 0 1 0 0 1 0 0 1 0 0 0 3 8.00 16 0.50 0 1 6 8 1
valle valles valor SUST valor valores valoración SUST valoración valoraciones valorar V valora valoraba valoradas valorado valoramos valorando valorar valoró
5.50 10 0.55 0 1 5 3 1 0 1 2 1 0 0 0 1 0 0 0 0 1 1 1 0 0 1 1 0 11.34 18 0.63 2 0 4 8 4 0 0 0 2 0 0 0 0 1 0 2 0 3 3 4 0 0 1 2 0 9.38 14 0.67 5 5 2 1 1 3 5 2 1 1 2 0 0 0 0 119.90 218 0.55 11 5 109 68 25 11 5 31 36 17 0 0 78 32 8 5.85 15 0.39 0 1 3 10 1 0 1 3 8 1 0 0 0 2 0 9.86 17 0.58 0 1 8 5 3 0 0 0 0 1 0 0 0 0 1 0 0 1 0 0 0 0 1 0 0 0 0 1 0 0 0 1 0 0 0 0 0 5 5 0 0 0 0 0 1
vegetal | 459
valorización SUST
3.92 8 0.49 1 0 3 4 0 0 0 3 4 0 1 0 0 0 0
varios ADJ IND
vano SUST
3.64 7 0.52 3 3 1 0 0
varios PRON IND
vapor SUST
3.40 5 0.68 1 2 0 1 1 1 0 0 1 0 0 2 0 0 1
valorización valorizaciones
vapor vapores vara SUST
4.64 8 0.58 0 2 3 3 0
varias varios
varias varios varón SUST varón varones vaso SUST
variable
SUST
variable variables
8.40 30 0.28 0 0 5 23 2 0 0 2 6 0 0 0 3 17 2
vaso vasos vasto ADJ CAL
variación SUST variación variaciones variante SUST variante variantes variar V habría variado han variado varía variada variadas variado variados varían variando variar variaron varió variedad
SUST
variedad variedades
10.50 15 0.70 1 2 2 6 4 1 1 2 3 0 0 1 0 3 4 3.92 8 0.49 0 1 0 4 3 0 1 0 3 2 0 0 0 1 1 30.72 48 0.64 2 4 13 21 8 0 0 0 1 0 0 0 1 0 1 0 0 0 2 1 1 0 0 2 0 1 1 1 6 0 0 0 3 0 1 0 0 2 4 2 0 0 1 1 0 0 0 0 3 0 0 2 3 2 2 0 1 1 0 0 0 0 1 0 1 14.52 22 0.66 1 4 4 10 3 0 3 4 8 2 1 1 0 2 1
vasta vastas vastísima vasto vastos vecino ADJ CAL vecina vecinas vecino vecinos vecino SUST vecina vecinas vecino vecinos
121.18 146 0.83 10 37 34 33 32 4 20 16 18 10 6 17 18 15 22 5.00 5 1.00 1 1 1 1 1 0 0 0 1 0 1 1 1 0 1 7.68 12 0.64 1 1 4 5 1 1 0 0 4 0 0 1 4 1 1 4.96 16 0.31 2 12 0 1 1 1 6 0 0 1 1 6 0 1 0 5.94 11 0.54 0 1 6 2 2 0 0 2 1 1 0 0 1 0 0 0 0 1 0 0 0 1 2 1 0 0 0 0 0 1 10.64 14 0.76 2 3 3 1 5 1 1 0 0 1 1 1 0 0 0 0 1 0 1 2 0 0 3 0 2 23.04 32 0.72 5 12 3 3 9 2 4 0 1 0 2 2 0 0 0 1 2 1 1 1 0 4 2 1 8
vegetación SUST
4.48 7 0.64 3 2 1 1 0
vegetal ADJ CAL
4.97 7 0.71 1 2 2 2 0 1 1 2 2 0 0 1 0 0 0
vegetal vegetales
El Léxico básico del español de Chile es un diccionario de frecuencias: un tipo poco habitual de diccionario que registra las alrededor de cinco mil palabras más usadas en nuestro país, basado en el análisis estadístico de más de 500 mil palabras extraídas de alrededor de cuatro mil obras publicadas por autores chilenos en un rango de más de 25 años. Los vocablos que contiene se caracterizan por tener escasa dependencia del tema, contexto, género discursivo o tipo de texto, lo que significa que pueden aparecer en textos orales y escritos dirigidos a públicos diversos en que se traten diferentes temáticas, en diferentes contextos. Conocer y comprender estas palabras permite acceder a más del 90% de los textos producidos en Chile. Contar con un diccionario como este, permite determinar de manera objetiva qué palabras necesitan aprender los estudiantes y en qué orden conviene que las aprendan. Este proyecto busca, por un lado, contribuir a preservar nuestro patrimonio cultural inmaterial, reflejo de nuestra identidad nacional; por otro lado, se propone colaborar con la educación en general, facilitando la planificación de la adquisición del español como lengua materna y del español como segunda lengua y ofreciendo herramientas que contribuyan a la generación de políticas públicas educativas y lingüísticas basadas en la realidad de la lengua.