0:00:00.156,0:00:03.683 Isso e "The Rundown", e eu sou Hari Sreenivasan. Hoje estamos falando de palavras. 0:00:03.683,0:00:09.732 Comigo agora e a lexicografa Erin McKean, que e CEO e fondador de Wordnick.com 0:00:09.732,0:00:10.885 Obrigado para vir aqui. 0:00:10.885,0:00:12.535 De nada. Obgrigada. 0:00:12.535,0:00:18.356 Google recentemente lancou um tipo de website o seja base de dados, junto com um team de Harvard-- 0:00:18.356,0:00:23.531 o NGRAM, que permite as pessoas buscar palavras atraves de centenas e milhaes 0:00:23.531,0:00:28.427 de livros e periodocos etc, desde as ultimas decadas 0:00:28.427,0:00:30.250 O que fez quando ouviu dessa iniciativa? 0:00:30.250,0:00:36.033 Fuimos muito impressionados quando percebemos que google estava publicando os dados NGRAM com um licenca muito aberto 0:00:36.033,0:00:41.181 Porque significa que muita gente pode pegar esses dados e tentar fazer coisas legais com eles. 0:00:41.181,0:00:44.957 E claro em Wordnik, somos muito interessados em fazer coisas legais com palavras 0:00:44.957,0:00:50.320 Entao os dados sao baseados em alguma coisa tipo 5 porcento do corpus de Google Books, 0:00:50.320,0:00:53.878 que nao e muito, mas sao muitas palavras. 0:00:53.878,0:00:59.966 O que nos ensina sobre a lingua inglesa ter tanto acesso a ocurenca de palavras atraves de tempo? 0:00:59.966,0:01:07.814 Agora mesmo, pode pensar do tipo de cienca atras do visualisador NGRAM como tipo, 0:01:07.814,0:01:10.696 por exemplo, antibioticos foram, antigamente. 0:01:10.696,0:01:16.173 Eles nao sao bem especificos, entao nao pode diferenciar entre, por exemplo 0:01:16.173,0:01:19.151 a palavra "pretty" por exemplo, quando significa "bonita" 0:01:19.151,0:01:23.670 e a palavra "pretty" quando esta numa construção, como, "Aquela coisa foi 'pretty neat' (bem legal)." 0:01:23.670,0:01:29.233 Estamos usando mas palavras agora? Sera' que a tarefa do crescimento na lignua inglesa esta aumentando? 0:01:29.233,0:01:36.768 Agora podemos medir isso melhor que nunca, entao na publicaçao que 0:01:36.768,0:01:40.232 as pesquisadores de Google e de Harvard publicaram em Science 0:01:40.232,0:01:45.124 eles estavam falando que eles perecebem mais palavras aparecendo com a passagem de tempo 0:01:45.124,0:01:49.897 e tambem alguma coisa que eu fui feliz ter gente de Google e Harvard pra me apoiar 0:01:49.897,0:01:54.082 que eles estimaram que 52 porcento das palavras que examinaram 0:01:54.082,0:01:56.752 nao estavam nos dicionarios onde eles procuraram 0:01:56.752,0:01:58.259 Como e possivel? 0:01:58.259,0:02:02.972 E o seguinte: tem muitas palavras que acontecem so uma vez, "nonce words" 0:02:02.972,0:02:06.746 se voce ta fazendo um dicionario impressado, voce simplesmente nao tem tempo para colocar. 0:02:06.746,0:02:09.724 E pra alguem que nunca fui para Wordnik, qual e a diferenca entre 0:02:09.724,0:02:12.963 Wordnik e indo para os outros dicionarios online? 0:02:12.963,0:02:17.691 Entao, Wordnik tem quase seis vezes mas palavras do que todos os outros dicionarios. 0:02:17.691,0:02:22.994 Entao nos mostramos tanto informação quanto puder, sobre o numero maximo de palavras 0:02:22.994,0:02:26.260 Entao se tivesse uma definicao dum dicionario tradicional, nos mostriamos aquilo. 0:02:26.260,0:02:29.264 Mas se temos somente tres frases boas 0:02:29.264,0:02:32.842 do Wall Street Journal, o Forbes, o Huffington Post, nos mostriamos aquilo 0:02:32.842,0:02:38.824 dizendo "Jornalistas nao estao usando esta palavra. Pode usar as frases deles como um modelo." 0:02:38.824,0:02:40.888 Assim que esta aproximando o ano novo 0:02:40.888,0:02:46.139 quais sao as palavras mais populares de 2010 o 2011 que voces estao vendo? 0:02:46.139,0:02:50.371 E interessante, a gente sempre quer as palavras mais usadas do ano, mas normalmente 0:02:50.371,0:02:58.024 palavras incubam, enterradas como sementes por um tempo ate surgir no conhecimento popular 0:02:58.024,0:03:02.805 Algumas palavras nos quais estou particularmente interessada recentemente sao do tipo 0:03:02.805,0:03:08.343 palavras sobre conseguencias negativas, como "geoslavery" (geo-escravidao). 0:03:08.343,0:03:10.798 E o que significa "geoslavery"? 0:03:10.798,0:03:17.773 "geoslavery" e o ideia que com toda a funcionalidade GPS e localização nos cellulares 0:03:17.773,0:03:25.949 que os parceiros e esposos abusivos podem usar esses dados pra manter um grao de controle ate mais restritivo sobre os seus parceiros 0:03:25.949,0:03:29.189 Com o ideia que estao realmente tentando forçar limites de comportamento 0:03:29.189,0:03:31.331 O que mais ta surgendo como um semente? 0:03:31.331,0:03:39.167 Eu gosto da palavra "aftercrimes" (post-crimes), que esta feito com analogia a "aftershocks" 0:03:39.167,0:03:43.869 Sao as crimes pequenas que acontecem numa area depois que aconteceu um crime grande 0:03:43.869,0:03:49.381 Entao qual e a meta final para Wordnik? Que se transforme no dicionario preferido de todo mundo? 0:03:49.381,0:03:52.803 Estamos tentando mapear toda a lingua inglesa. 0:03:52.803,0:03:55.285 Nos queriamos ser GPS para palavras 0:03:55.285,0:03:58.707 mostrando informacao sobre todas as palavras possiveis. 0:03:58.707,0:04:02.364 Bom, Erin McKean, CEO e fondador de Wordnik, lexigrafo 0:04:02.364,0:04:04.480 Obrigado e bom palavrando! 0:04:04.480,0:04:06.100 Muito obrigada. 0:04:06.100,0:04:09.123 Eu sou Hari Sreenivasan, isto e "The Rundown". Fica aqui conosco.