Subject: sum : frequency

some weeks ago , i made a query on linguist list about frequency vocabularies on english , french , german and spanish . many people responded with helpful comments , which are summarised below . thanks to everybody who wrote to me . your suggestions and information are very important for my work . my name is erik willis and i attend brigham young university as a masters student in spanish . one of our professors is very active in frequency counts , his name is orlando alba . ( orlando _ alba @ byu . edu ) i know his teacher humberto lopez morales was very active in that field also . their respective corpora are based on the dom . rep . puerto rico and i believe mexico and were based on availability ( lexico disponible ) . hasta ahora no creo que tengan algo en el net . el que mejor conoce los recursos del net el francisco marcos marin en la autonoma de madrid . no tengo su e-mail . i am also working with frequency counts but at a phonological level . i am looking at written and oral narratives which i believe has not been done . ojala podamos ayudarnos mutuamente con bibliografias etc . erik willis willisew @ itsnet . com - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - estimado marcial : hay varios recuentos existentes ya , entre ellos : helen eaton , ca . 194 ? . ( me olvido del ti ' tulo , pero es algo como : frecuency counts in 5 european languages . no se ' quie ' n lo publico ' originariamente , pero la dover press lo volvio ' a publicar en ' paperback ' por eso de los 60s o 70s . luis fernando lara en el colegio de me ' xico ha hecho mucho en este sentido ( con base en textos seleccionados de un total de [ creo ] 2 millones de palabras de texto corrido ) . e ' l esta ' en el dem [ diccionario del espan ~ ol de me ' xico ] , y actualmente es el director del cell [ centro de estudios de lingu " i 's tica y literatura ] de el colegio de me ' xico ( e-mail : lara @ colmex . mx , aunque no estoy 100 % seguro del prefijo ) . e ' l te puede asesorar mucho al respecto . tb . hay muchos investigadores del ana ' lisis de corpus en la propia espan ~ a , aunque no me acuerdo en estemomento de sus nombres . yo a mediano plazo emprendere ' un proyecto con propo 's ito similar , pero con un corpus de gigapalabras , para poder investigar el uso de formas de palabras ( por ej . , el futuro del subjuntivo , etc . ) con algo de detalle , asi ' como los nombres propios , etc . sin embargo , no tengo mucho hecho al respecto hasta la fecha . jim james l . fidelholtz e-mail : jfidel @ siu . cen . buap . mx a ' rea de ciencias del lenguaje o : jfidel @ cca . pue . udlap . mx instituto de ciencias sociales y humanidades universidad auto ' noma de puebla , me ' xico - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - estimado marcial , un colega mio de la universidad de oviedo acaba de publicar un diccionario de frecuencias del castellano . su direccion es : jose ramon alameda < jalameda @ sci . cpd . uniovi . es > en cuanto al diccionario que ud . va a recopilar , ud . piensa etiquetear las palabras . es decir , va a distinguir entre en numero de casos de ' casa ' que son del sustantivo ' casa ' y los que viene del verbo ' casar ' ? - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - david eddington mississippi state university i used two frequency lists in research i conducted almost 20 years ago : one is the keniston list , 2000 words divided into groups of 500 for frequency of words in print in peninsular spanish . the other is rodriquez and bou for frequency of words in print for puerto rican spanish . joel walters department of english bar - ilan university ramat gan , israel - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i produced the frequency list for longman 's dictionary . both the paper and assorted frequency lists are available from my web page ( see below ) . if you have troubel accessign the paper , feel free to email me again and i ' ll send it , happy surfing , adam % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % adam kilgarriff = 20 senior research fellow tel : ( 44 ) 1273 642919 = 20 information technology research institute ( 44 ) 1273 642900 = 20 university of brighton fax : ( 44 ) 1273 642908 lewes road = 20 brighton bn2 4gj email : adam . kilgarriff @ itri . bton . ac . uk uk http : / / www . itri . bton . ac . uk / ~ adam . kilgarriff % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - entra por ftp anonimo en ftp-lsi . upc . es cambia al directorio pub / lluisp alli encontraras los ficheros spanish . freq ( frecuencias de palabras en espa = f1ol sacadas de un corpus de 3m de palabras ) wsj . freq ( frecuencias de palabras en ingles sacadas de 1 . 1m de palabras del wsj ) tienes que uudecodear y gzunzipar los ficheros suerte lluis padro - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - hola marcial : aunque es muy probable que ya las tengas , te envio las referencias que tengo a mano sobre frecuencias lexicas del castellano , por si te pueden ayudar : patterson , william ; y urrutibeheity , hector , _ the lexical structure of spanish _ , mouton , la haya - par = eds , 1975 . = 20 juilland , alphonse ; y chang-rodriguez , eugenio , _ frequency dictionary of spanish words _ , mouton , londres - la haya - par = eds , 1964 . patterson , william t . , " on the genealogical structure of the spanish vocabulary " , en ? ? ? , pp . 309-339 . garcia hoz , victor , _ estudios experimentales sobre el vocabulario _ , csic , madrid , 1977 . _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ javier gomez guinovart < uvifejgg @ cesga . es > http : / / www . uvigo . es / departamentos / dep / h06 / webh06 / sli / index . html univ . de vigo - fac . de humanidades - apartado 874 - e-36200 vigo tel : + 34 + 86 + 812360 - fax : + 34 + 86 + 812380 - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - i have a copy of : an english - french - german - spanish word frequency dictionary subtitle : a correlation of the first 6000 words in four single-language frequency lists compiled by helen s . eaton , teachers college , columbia univ ; visiting instructor , univ of new mexico ; diplomee , sorbonne , universite de paris 441 pages , paperback , dover publications , inc , new york . copyright 1940 , 1967 by helen s . eaton there are separate indexes for english , french , german and spanish words . appendix ii is a conceptual analysis of substantives , verbs and adjectives in the list . pub in canada by general publ co ltd , 30 lesmill road , don mills , toronto , ontario pub in uk by constable and co , ltd , 10 orange st , london , w . c . 2 pub in us by dover publications inc , 180 varick st , new york , ny 10014 lccn : 61-4487 / s / israel cohen new dimension software ltd izzy @ telaviv . ndsoft . com
