1 00:00:06,180 --> 00:00:08,410 Olá a todos. 2 00:00:08,410 --> 00:00:11,636 É espantoso ter-vos a todos aqui e serem tantos. 3 00:00:11,647 --> 00:00:13,298 É mesmo, mesmo ótimo. 4 00:00:14,659 --> 00:00:19,541 Então, a Lea já falou muito sobre este evento. 5 00:00:19,541 --> 00:00:22,875 Eu vou falar um pouco sobre a Wikidata propriamente dita 6 00:00:22,875 --> 00:00:26,255 e o que lhe tem estado a acontecer durante o último ano 7 00:00:26,255 --> 00:00:28,151 e para onde estamos a ir. 8 00:00:28,663 --> 00:00:32,974 Então... o que é isto? Desculpem. 9 00:00:40,118 --> 00:00:44,329 Então... onde estamos? Para onde estamos a ir? 10 00:00:44,950 --> 00:00:49,680 Ao longo do último ano houve muito para celebrar 11 00:00:49,680 --> 00:00:52,329 e queria salientar algumas dessas coisas 12 00:00:52,329 --> 00:00:55,125 porque às vezes passam despercebidas. 13 00:00:56,855 --> 00:01:03,864 E, em primeiro lugar, quero rever convosco algumas estatísticas de editores, 14 00:01:03,865 --> 00:01:07,119 o nosso conteúdo e como os nossos dados são usados. 15 00:01:10,376 --> 00:01:14,976 Ao longo do último ano a nossa comunidade cresceu 16 00:01:14,976 --> 00:01:16,720 o que é espantoso. 17 00:01:16,724 --> 00:01:21,248 Temos, aproximadamente, 3000 pessoas novas 18 00:01:21,248 --> 00:01:25,963 que editam uma vez ou mais a cada 30 dias. 19 00:01:26,133 --> 00:01:30,176 Portanto, isso são mais de 3000 Wikidatans novos! 20 00:01:30,176 --> 00:01:31,617 (risos) 21 00:01:31,617 --> 00:01:36,544 Agora, se olharem para os que fazem mais, por exemplo cinco edições a cada 30 dias, 22 00:01:36,544 --> 00:01:40,727 temos mais aproximadamente 1 200. 23 00:01:40,995 --> 00:01:44,202 E se olharem para as pessoas que fazem 100 edições ou mais-- 24 00:01:44,202 --> 00:01:47,366 espero que muitos dos que aqui estão-- 25 00:01:47,366 --> 00:01:48,996 temos mais 300. 26 00:01:49,277 --> 00:01:51,450 Levantem a mão se estiverem neste grupo. 27 00:01:52,733 --> 00:01:56,049 Vocês são demais! 28 00:01:58,059 --> 00:02:00,906 E enquanto... 29 00:02:00,906 --> 00:02:06,016 o número de edições não é algo a que normalmente 30 00:02:06,016 --> 00:02:08,592 prestemos muita atenção, 31 00:02:08,592 --> 00:02:12,683 nós acabamos por ultrapassar a marca dos mil milhões de edições este ano. 32 00:02:12,967 --> 00:02:19,087 (aplausos) 33 00:02:21,347 --> 00:02:23,224 Vamos, então, olhar para o conteúdo. 34 00:02:27,610 --> 00:02:31,222 Então, estamos agora com 65 milhões de items, 35 00:02:31,462 --> 00:02:34,093 portanto, entidades para descrever o mundo 36 00:02:34,093 --> 00:02:40,541 e estamos a fazê-lo com, aproximadamente, 6 700 propriedades. 37 00:02:43,667 --> 00:02:48,079 Dessas, à volta de 4 300 são identificadores externos, 38 00:02:48,079 --> 00:02:53,328 o que nos dá muitas ligações a outros catálogos, bases de dados, 39 00:02:53,328 --> 00:02:55,607 websites e mais 40 00:02:55,927 --> 00:02:59,024 e realmente fazem da Wikidata um lugar central 41 00:02:59,024 --> 00:03:01,594 numa rede aberta ligada de dados. 42 00:03:02,453 --> 00:03:07,241 Então, usando essas propriedades e items, 43 00:03:07,241 --> 00:03:11,990 temos agora perto de 800 milhões de declarações 44 00:03:11,990 --> 00:03:15,892 e comparado com o ano passado, sabemos mais meia declaração 45 00:03:15,892 --> 00:03:18,365 acerca de cada um dos items. 46 00:03:18,365 --> 00:03:20,480 (risos) 47 00:03:22,595 --> 00:03:25,144 Então, sim, a Wikidata ficou mais esperta. 48 00:03:26,914 --> 00:03:29,724 Mas não temos apenas items e propriedades, 49 00:03:29,724 --> 00:03:33,854 também temos coisas novas como os lexemas. 50 00:03:33,866 --> 00:03:39,825 Temos agora 204 000 lexemas que descrevem palavras 51 00:03:39,825 --> 00:03:41,860 em muitas linguagens diferentes. 52 00:03:41,939 --> 00:03:43,241 É muito fixe. 53 00:03:43,668 --> 00:03:47,661 Vou falar mais sobre isto numa outra sessão mais tarde. 54 00:03:48,860 --> 00:03:52,690 Por último, a mais recente adição são esquemas de entidades 55 00:03:52,690 --> 00:03:58,503 que nos ajudam a descobrir como modelar, consistentemente, modelos de dados 56 00:03:58,503 --> 00:04:00,971 ao longo de determinadas áreas. 57 00:04:02,171 --> 00:04:04,552 E, desses, temos aproximadamente 140. 58 00:04:07,571 --> 00:04:11,432 Mas números não são tudo em relação ao conteúdo, certo-- 59 00:04:11,432 --> 00:04:14,697 quantidade de conteúdo-- também nos importa a qualidade do mesmo. 60 00:04:15,613 --> 00:04:21,976 E o que fizemos agora foi treinar um sistema de aprendizagem máquina 61 00:04:21,976 --> 00:04:25,287 para avaliar a qualidade de qualquer item. 62 00:04:25,822 --> 00:04:29,531 Isto está longe de ser perfeito, mas já vos dá uma ideia. 63 00:04:29,916 --> 00:04:35,011 Portanto, cada item na Wikidata recebe um resultado entre 1 e 5. 64 00:04:35,011 --> 00:04:37,895 Um é mesmo terrível, cinco é extraordinário. 65 00:04:38,446 --> 00:04:41,901 E ele olha para coisas como quantas declarações tem, 66 00:04:41,901 --> 00:04:44,031 quantos identificadores externos tem, 67 00:04:44,031 --> 00:04:45,922 quantas referências estão lá, 68 00:04:45,922 --> 00:04:49,414 quantas etiquetas diferentes temos em quantas línguas diferentes 69 00:04:49,414 --> 00:04:50,604 e assim por diante. 70 00:04:50,727 --> 00:04:55,118 E, depois, olhamos para a Wikidata ao longo do tempo 71 00:04:55,118 --> 00:04:59,751 e, como podem ver, com base nestas medidas 72 00:04:59,751 --> 00:05:03,918 fomos de verdadeiramente terríveis a bem melhores. 73 00:05:03,918 --> 00:05:05,238 (risos) 74 00:05:05,649 --> 00:05:07,068 Logo, é bom. 75 00:05:07,303 --> 00:05:11,961 Mas, o que também conseguimos ver é que ainda falta muito para o cinco. 76 00:05:11,961 --> 00:05:13,312 (risos) 77 00:05:13,664 --> 00:05:20,171 Eu não penso que seja aqui que chegaremos, certo? 78 00:05:20,171 --> 00:05:23,263 Nem todos os items vão estar absolutamente perfeitos 79 00:05:23,266 --> 00:05:26,087 de acordo com o que temos medido. 80 00:05:26,354 --> 00:05:29,169 Mas estou realmente contente por ver que, consistentemente, 81 00:05:29,169 --> 00:05:32,387 a qualidade dos dados está a melhorar. 82 00:05:36,709 --> 00:05:43,111 Mas criar dados não é suficiente. 83 00:05:44,428 --> 00:05:46,734 Queremos que isto... fazemos isto por uma razão. 84 00:05:46,734 --> 00:05:48,749 Queremos que sejam usados. 85 00:05:48,749 --> 00:05:55,450 E, agora, olhámos para a quantidade de artigos 86 00:05:55,450 --> 00:06:00,770 noutros projetos da Wikmedia que usam dados da Wikidata 87 00:06:02,040 --> 00:06:06,762 e olhámos para a percentagem de todos os artigos nesses projetos. 88 00:06:07,395 --> 00:06:09,554 Se olharmos para todo o espetro da Wikimedia 89 00:06:09,554 --> 00:06:11,989 e para todos os artigos que existem, 90 00:06:11,989 --> 00:06:18,768 então, hoje, 56,35% de todos usam alguns dados da Wikidata. 91 00:06:20,054 --> 00:06:21,815 O que eu considero muito bom, 92 00:06:21,815 --> 00:06:27,378 mas claro que ainda há muito que andar para chegarmos aos 100%. 93 00:06:29,085 --> 00:06:33,811 E depois, eu olho para quais os projetos que realmente estao a fazer maior uso 94 00:06:33,811 --> 00:06:36,188 dos dados da Wikidata 95 00:06:36,188 --> 00:06:39,401 e divido isto por versões de linguagem e assim por diante. 96 00:06:39,606 --> 00:06:44,997 E, agora, o que é que pensam que os cinco primeiros projetos... 97 00:06:45,577 --> 00:06:48,254 quais deles são todos? 98 00:06:48,254 --> 00:06:50,834 A que família de projetos pertencem? 99 00:06:51,036 --> 00:06:53,177 (algumas vozes na audiência) Commons. 100 00:06:53,177 --> 00:06:56,607 Certo. Commons é mais ou menos geral. 101 00:06:57,216 --> 00:06:58,903 Na verdade, estariam enganados. 102 00:06:58,903 --> 00:07:01,684 Todos os cinco primeiros são da Wikivoyage. 103 00:07:02,084 --> 00:07:03,650 (plateia) Oh! 104 00:07:03,692 --> 00:07:05,044 (risos) 105 00:07:05,439 --> 00:07:08,345 Portanto, sim, um aplauso para a Wikivoyage. 106 00:07:08,345 --> 00:07:13,773 (aplausos) 107 00:07:16,710 --> 00:07:20,383 Se querem saber onde os Commons estão 108 00:07:20,383 --> 00:07:22,053 e onde estão todos os vossos projetos, 109 00:07:22,053 --> 00:07:23,521 há um painel de controlo. 110 00:07:23,521 --> 00:07:26,083 Venham comigo e vamos dar uma vista de olhos. 111 00:07:28,049 --> 00:07:32,016 Claro, os nossos dados não são usados só dentro da Wikimedia. 112 00:07:32,016 --> 00:07:34,606 Também são usados fora e aconteceu tanto. 113 00:07:34,966 --> 00:07:39,256 Eu não posso mencioná-los a todos, mas para salientar alguns 114 00:07:39,518 --> 00:07:44,028 que são os maiores utilizadores dos nossos dados: o Met, o Fundo Wellcome, 115 00:07:44,030 --> 00:07:45,687 a Livraria do Congresso, 116 00:07:45,687 --> 00:07:47,848 o GeneWiki e muitos muitos mais. 117 00:07:47,951 --> 00:07:51,296 E, se assistirem a algumas apresentações que estão mais tarde no programa, 118 00:07:51,296 --> 00:07:53,292 vão ouvir falar de alguns deles. 119 00:07:56,635 --> 00:07:59,608 Certo, chega de estatísticas. 120 00:07:59,807 --> 00:08:02,171 Vamos salientar aqui outros pontos. 121 00:08:02,644 --> 00:08:06,897 Portanto, já falámos sobre a melhoria da qualidade dos dados 122 00:08:06,897 --> 00:08:10,646 e, quando vemos a qualidade dos dados, há muitas dimensões 123 00:08:10,646 --> 00:08:16,426 para onde podemos olhar e podemos melhorar algumas delas, 124 00:08:16,482 --> 00:08:18,980 tal como quão fiáveis são, 125 00:08:18,980 --> 00:08:20,751 quão confiáveis são, 126 00:08:20,751 --> 00:08:22,515 quão referenciados estão, 127 00:08:22,515 --> 00:08:24,865 quão consistentemente são modelados, 128 00:08:26,351 --> 00:08:28,992 quão completos estão e assim por diante. 129 00:08:31,263 --> 00:08:35,746 Só para escolher um... para a consistência por exemplo, 130 00:08:35,746 --> 00:08:42,355 criámos a capacidade de guardar esquemas de entidades na Wikidata 131 00:08:42,355 --> 00:08:46,553 para que possam descrever como certos domínios devem ser modelados. 132 00:08:46,736 --> 00:08:49,172 Para que possam encontrar... 133 00:08:49,557 --> 00:08:53,902 Podem criar um esquema de entidade, digamos, pintores Holandeses 134 00:08:53,902 --> 00:08:56,492 e depois podem verificar como... 135 00:08:56,492 --> 00:08:59,359 que items que são para pintores Holandeses 136 00:08:59,359 --> 00:09:02,470 não têm, por exemplo, uma data de nascimento, mas que deviam 137 00:09:02,470 --> 00:09:05,235 e coisas desse género. 138 00:09:05,557 --> 00:09:10,011 E espero que muitos mais projetos wiki e outros 139 00:09:10,011 --> 00:09:13,291 possam fazer melhor uso dos esquemas de entidades para tratarem 140 00:09:13,291 --> 00:09:15,925 os seus dados. Se quiserem aprender como fazê-lo, 141 00:09:15,925 --> 00:09:18,055 vai haver também uma sessão mais tarde 142 00:09:18,055 --> 00:09:22,892 de pessoas que sabem tudo sobre isto e que farão disto um 143 00:09:22,892 --> 00:09:24,858 mistério menor. 144 00:09:27,575 --> 00:09:28,745 Muito bem. 145 00:09:30,899 --> 00:09:34,701 Outra coisa que realmente ganhou tração 146 00:09:34,774 --> 00:09:37,867 no último ano foi o ecossistema Wikibase, certo? 147 00:09:37,867 --> 00:09:44,015 Esta ideia que nem todos os dados abertos devem e têm que estar 148 00:09:44,015 --> 00:09:47,490 na Wikidata mas que, em vez disso, queremos ter um ecossistema vibrante 149 00:09:47,490 --> 00:09:51,151 de diferentes lugares, com diferentes agentes, 150 00:09:51,151 --> 00:09:53,513 como instituições, companhias, 151 00:09:53,513 --> 00:09:56,929 programas de voluntariado que divulguem os seus dados da mesma forma 152 00:09:56,929 --> 00:10:00,372 que a Wikidata faz e depois ligarmos tudo isto, 153 00:10:00,372 --> 00:10:03,317 trocando dados entre eles, ligando esses dados. 154 00:10:04,282 --> 00:10:08,808 E, ao longo do último ano, o interesse nisto 155 00:10:08,808 --> 00:10:11,760 e o interesse nas instituições e nas pessoas que dirigem 156 00:10:11,760 --> 00:10:14,977 as suas próprias instâncias baseadas em Wiki, realmente explodiu, 157 00:10:14,977 --> 00:10:20,466 especialmente no setor das bibliotecas. 158 00:10:23,009 --> 00:10:26,210 Há muitos testes, avaliações, 159 00:10:26,226 --> 00:10:28,787 e para ser honesta, pioneirismo 160 00:10:28,787 --> 00:10:33,536 a acontecer neste momento, quando instituições aventureiras 161 00:10:33,536 --> 00:10:38,872 trabalham connosco para descobrir como a Wikibase pode funcionar 162 00:10:38,872 --> 00:10:42,243 para as suas coleções, os seus catálogos e assim por diante. 163 00:10:42,539 --> 00:10:45,024 Entre elas, a Biblioteca Nacional Alemã, 164 00:10:45,024 --> 00:10:46,419 a Biblioteca Nacional Francesa, 165 00:10:46,419 --> 00:10:49,194 OCLC e, claro, isso é muito entusiasmante. 166 00:10:55,278 --> 00:10:57,360 Uma das razões porque penso isso 167 00:10:57,360 --> 00:11:02,868 é que estamos a ajudar essas instituições a abrir os seus dados de uma forma que 168 00:11:02,868 --> 00:11:07,914 não é só colocá-los num site onde alguém pode acessá-los 169 00:11:07,926 --> 00:11:11,947 mas realmente a pensar sobre isto, no próximo passo depois disto, certo? 170 00:11:11,947 --> 00:11:15,229 Deixar que as pessoas ajudem a manter os dados, melhorá-los, 171 00:11:15,229 --> 00:11:20,449 enriquecê-los e isso é uma viragem 172 00:11:20,450 --> 00:11:24,526 que eu espero que traga muitas coisas boas. 173 00:11:26,041 --> 00:11:27,859 E a outra coisa com a qual nos ajuda 174 00:11:27,859 --> 00:11:31,203 é que deixa os especialistas curarem os dados 175 00:11:31,203 --> 00:11:37,474 no seu espaço, mantê-los em bom estado para que possamos implementar 176 00:11:37,474 --> 00:11:42,317 processos de sincronização com a Wikidata, por exemplo. 177 00:11:42,317 --> 00:11:45,604 Em vez de, permanentemente, estarmos nós a fazermos isso. 178 00:11:46,519 --> 00:11:50,223 E, no final do dia, espero que tire alguma pressão 179 00:11:50,223 --> 00:11:53,776 de cima da Wikidata, para ser aquele lugar onde tudo tem que ir parar. 180 00:11:58,040 --> 00:12:00,450 Dados lexicográficos. 181 00:12:01,962 --> 00:12:06,997 Ao longo do último ano, as pessoas começaram a descrever palavras, 182 00:12:06,997 --> 00:12:12,264 na sua língua, na Wikidata para que se possam construir coisas 183 00:12:12,264 --> 00:12:14,713 como ferramentas automatizadas de tradução. 184 00:12:16,413 --> 00:12:21,019 E estamos num ponto em que, em algumas línguas, 185 00:12:21,019 --> 00:12:25,500 estamos a começar a chegar perto de atingir essa massa crítica 186 00:12:25,500 --> 00:12:29,143 que é precisa para realmente construir uma aplicação séria. 187 00:12:29,527 --> 00:12:32,614 Em muitas línguas ainda temos um longo caminho a percorrer, 188 00:12:32,614 --> 00:12:35,411 mas noutras começamos mesmo a chegar lá 189 00:12:35,411 --> 00:12:37,265 e isso é realmente ótimo de se ver. 190 00:12:38,621 --> 00:12:41,430 Se quiserem saber mais, venham à minha apresentação mais tarde. 191 00:12:46,064 --> 00:12:48,954 E, obviamente, não podemos esquecer 192 00:12:48,954 --> 00:12:50,955 dados estruturados nos Commons. 193 00:12:51,150 --> 00:12:52,384 (membro da plateia assobia) 194 00:12:52,384 --> 00:12:54,052 Sim! (risos) 195 00:12:54,056 --> 00:12:59,324 (aplausos) 196 00:12:59,324 --> 00:13:01,515 Os dados estruturados nos Commons que vimos na fundação 197 00:13:01,515 --> 00:13:05,571 realmente juntaram... 198 00:13:07,121 --> 00:13:11,459 tudo e tornaram possível 199 00:13:11,459 --> 00:13:15,479 adicionar declarações a ficheiros nos Commons ao longo do último ano. 200 00:13:15,479 --> 00:13:18,586 E as pessoas começaram a adicionar essas declarações a imagens 201 00:13:18,586 --> 00:13:22,770 para as tornarem mais fáceis de encontrar, para se construirem melhores aplicações 202 00:13:22,770 --> 00:13:24,292 com base nelas e muito mais. 203 00:13:24,292 --> 00:13:26,852 É realmente excitante ver como está a crescer. 204 00:13:26,852 --> 00:13:29,988 O que é realmente importante 205 00:13:29,988 --> 00:13:32,959 para a comunidade Wikidata perceber aqui 206 00:13:32,959 --> 00:13:36,555 é que, quando vemos "retratos" 207 00:13:36,555 --> 00:13:41,577 ou "gato de casa" ou "sentar", "lagarto" ou "parede", aqui, 208 00:13:41,577 --> 00:13:44,867 isso são ligações a items da Wikidata e propriedades. 209 00:13:45,425 --> 00:13:49,620 Isso significa que quando criamos items e propriedades, 210 00:13:49,620 --> 00:13:54,031 eles já não estão só a providenciar o vocabulário para a própria Wikidata. 211 00:13:54,031 --> 00:13:57,749 Estão a providenciar o vocabulário para os Commons também. 212 00:13:57,904 --> 00:14:00,695 E isto irá ser cada vez mais assim. 213 00:14:00,695 --> 00:14:02,929 Portanto, temos de prestar muita atenção 214 00:14:02,929 --> 00:14:06,550 a como a nossa ontologia, o nosso vocabulário 215 00:14:06,550 --> 00:14:09,777 é na realidade usado em mais sítios do que tínhamos antes. 216 00:14:13,589 --> 00:14:19,905 E o último que tenho é que começamos a construir pontes mais sólidas 217 00:14:19,905 --> 00:14:21,902 para os outros projetos da Wikimedia. 218 00:14:23,281 --> 00:14:26,159 A minha equipa e eu estamos a trabalhar no projeto Wikidata Bridge 219 00:14:26,159 --> 00:14:28,849 e vocês devem mesmo vir à cabina da interface 220 00:14:28,849 --> 00:14:32,904 e fazer uns teste do estado atual. 221 00:14:32,904 --> 00:14:36,240 Teremos lá alguns editores de Wikipédia 222 00:14:36,240 --> 00:14:38,970 a editar a Wikidata diretamente a partir dos seus projetos, 223 00:14:38,976 --> 00:14:40,988 sem terem de ir à Wikidata 224 00:14:40,988 --> 00:14:43,958 e sem terem de perceber tudo sobre ela. 225 00:14:43,958 --> 00:14:50,571 Espero que isto remova mais uma das dificuldades que tornam difícil 226 00:14:50,571 --> 00:14:54,498 que projetos da Wikimedia adotem mais dados da Wikidata. 227 00:14:57,165 --> 00:15:01,012 Muito bem, agora as estratégias e para onde estamos a ir. 228 00:15:03,005 --> 00:15:07,179 Desde Dezembro, a equipa da Wikidata na Wikimedia Alemanha 229 00:15:07,179 --> 00:15:12,262 e pessoal da Fundação Wikimedia têm estado a trabalhar em estratégias, 230 00:15:12,262 --> 00:15:14,675 papéis relacionados com a Wikidata. 231 00:15:14,675 --> 00:15:16,101 É, basicamente, colocar no papel 232 00:15:16,101 --> 00:15:19,526 o que muitos de nós andamos a falar 233 00:15:19,526 --> 00:15:22,958 ao longo dos últimos quatro ou cinco anos. 234 00:15:23,995 --> 00:15:29,492 E não sei se leram esses trabalhos. 235 00:15:29,492 --> 00:15:33,757 Eles estão publicados no Meta Commons até ao final do mês. 236 00:15:33,757 --> 00:15:35,806 Seria ótimo, se ainda não os tiverem lido, 237 00:15:35,806 --> 00:15:39,019 que os lessem, deixassem os vossos comentários, etc. 238 00:15:40,062 --> 00:15:44,338 Agora, uma muito rápida revisão sobre o que está lá, 239 00:15:44,338 --> 00:15:50,991 é que pensamos sobre a Wikidata e a Wikibase em três partes. 240 00:15:51,506 --> 00:15:55,442 Primeiro, a Wikidata como plataforma. 241 00:15:55,442 --> 00:15:57,023 Podem vê-la no canto inferior. 242 00:15:57,301 --> 00:16:03,876 Isso anda, na realidade, à volta da Wikidata permitir a cada pessoa 243 00:16:03,876 --> 00:16:06,273 aceder e partilhar informação 244 00:16:06,273 --> 00:16:09,038 independentemente da sua linguagem e tecnologia. 245 00:16:09,038 --> 00:16:14,479 Fazemos isso providenciando dados de interesse geral sobre o mundo. 246 00:16:14,479 --> 00:16:18,161 Então, basicamente, é o que vocês fazem todos os dias. 247 00:16:21,282 --> 00:16:25,497 Em segundo, está a parte do ecossistema Wikibase, 248 00:16:25,497 --> 00:16:30,047 onde a Wikibase, o software que suporta a Wikidata, alimenta 249 00:16:30,047 --> 00:16:34,993 não apenas a Wikidata, mas uma vibrante rede de dados abertos, a espinha dorsal 250 00:16:35,008 --> 00:16:36,817 de um conhecimento aberto, livre e grátis. 251 00:16:38,126 --> 00:16:43,005 Em terceiro e último está a Wikidata para os projetos Wikimedia, no topo. 252 00:16:43,005 --> 00:16:47,011 Onde a Wikidata está 253 00:16:47,011 --> 00:16:49,594 para ajudar os projetos Wikimedia... 254 00:16:50,750 --> 00:16:53,559 ajudá-los a estarem preparados para o futuro. 255 00:16:57,597 --> 00:17:02,973 Concretamente, o que isso significa para o futuro próximo ou médio? 256 00:17:03,898 --> 00:17:06,235 A Wikidata como plataforma. 257 00:17:06,669 --> 00:17:10,700 Temos de ter melhor qualidade dos dados, portanto continuaremos a trabalhar 258 00:17:10,700 --> 00:17:14,195 em melhores ferramentas, em melhorar as que temos e assim por diante. 259 00:17:14,633 --> 00:17:18,899 Temos de tornar os nossos dados mais acessíveis 260 00:17:18,899 --> 00:17:23,864 através de melhores APIs, parâmetros finais SPARQL mais robustos, 261 00:17:23,864 --> 00:17:27,315 mas também coisas como modelar os dados com mais consistência 262 00:17:27,315 --> 00:17:31,235 para que, na realidade, seja mais fácil reutilizá-los em aplicações. 263 00:17:31,867 --> 00:17:37,203 E a última coisa seria estabelecer processos de feedback 264 00:17:37,203 --> 00:17:38,769 com os nossos parceiros. 265 00:17:40,399 --> 00:17:43,905 Ao contrário da Wikipédia, a Wikidata não 266 00:17:43,905 --> 00:17:46,142 é o que costumo chamar um projeto destino, certo? 267 00:17:46,142 --> 00:17:49,166 Alguém vai à Wikipédia e lê algo 268 00:17:49,166 --> 00:17:50,852 enquanto, na Wikidata, o processo não é: 269 00:17:50,852 --> 00:17:53,295 alguém vai à Wikidata e lê algo. 270 00:17:53,295 --> 00:17:54,309 Seria ótimo, 271 00:17:54,309 --> 00:17:57,834 mas, realisticamente, não é isso a Wikidata é, certo? 272 00:17:57,882 --> 00:18:00,520 As pessoas que estão expostas 273 00:18:00,520 --> 00:18:02,719 aos nossos dados não estão na Wikidata propriamente, 274 00:18:02,770 --> 00:18:06,838 mas estão a ver o que querem através da Wikipédia e de outros sítios. 275 00:18:07,547 --> 00:18:12,238 Agora, esses outros sítios recebem comentários sobre os dados, certo? 276 00:18:12,238 --> 00:18:14,635 Os utilizadores dizem-lhes, "Isto está errado". 277 00:18:16,775 --> 00:18:20,952 Eu gostava de ter isso para que pudessemos torná-lo disponível 278 00:18:20,958 --> 00:18:24,179 às pessoas que realmente editam na Wikidata, ou seja vocês. 279 00:18:24,374 --> 00:18:27,212 E descobrir como fazer isso de uma forma robusta, 280 00:18:27,212 --> 00:18:31,679 sem sobrecarregar toda a gente, será um dos objetivos a atingir 281 00:18:31,679 --> 00:18:33,143 durante o próximo ano. 282 00:18:34,623 --> 00:18:37,127 Ecossistema Wikibase. 283 00:18:37,127 --> 00:18:40,925 Ali, continuaremos a trabalhar com as bibliotecas, 284 00:18:40,925 --> 00:18:46,192 mas também a olhar para as ciências, por exemplo, e mais ainda. 285 00:18:46,192 --> 00:18:51,641 Vai haver uma apresentação Wikibase mais logo e vocês deviam todos ir 286 00:18:51,641 --> 00:18:52,951 e ver o que já lá está 287 00:18:52,961 --> 00:18:55,792 e o que as pessoas estão já a fazer com a Wikibase. 288 00:18:55,792 --> 00:18:57,281 Vale mesmo a pena. 289 00:18:57,682 --> 00:19:00,832 E o que é preciso lá 290 00:19:00,832 --> 00:19:03,181 é também montar bons processos em torno disso. 291 00:19:04,384 --> 00:19:08,138 Ajudar as pessoas a descobrir com quem falar sobre o quê, 292 00:19:08,138 --> 00:19:10,467 onde podem encontrar ajuda, 293 00:19:10,467 --> 00:19:11,831 todo esses tipos de coisas. 294 00:19:13,474 --> 00:19:17,395 E, claro, facilitar a instalação e manutenção 295 00:19:17,395 --> 00:19:20,309 da Wikibase, porque ainda é uma séria dor de cabeça. 296 00:19:21,144 --> 00:19:24,617 E, por último, temos federação, que basicamente é 297 00:19:24,617 --> 00:19:27,245 o que falamos para os Commons, 298 00:19:27,245 --> 00:19:30,704 onde os Commons usam items e propriedades da Wikidata 299 00:19:30,704 --> 00:19:33,514 mas para outras instâncias da Wikibase 300 00:19:33,514 --> 00:19:36,488 para que eles também possam usar o vocabulário da Wikidata. 301 00:19:37,742 --> 00:19:42,107 E isso, como estava a dizer anteriormente, aumenta outra vez 302 00:19:42,107 --> 00:19:48,228 a necessidade de ter consciência de como o vocabulário é utilizado lá fora, 303 00:19:48,228 --> 00:19:51,055 mais do que tivemos até agora. 304 00:19:53,792 --> 00:19:56,556 E a Wikidata para projetos da Wikimedia. 305 00:19:56,972 --> 00:20:00,580 Integração mais estreita através da Wikidata Bridge 306 00:20:00,580 --> 00:20:04,154 e ajudar pessoas a editar diretamente a partir dos seus projetos. 307 00:20:04,154 --> 00:20:08,999 E a outra questão em que todos precisamos pensar juntos, 308 00:20:08,999 --> 00:20:14,684 é descobrir como reduzir as barreiras de linguagem. 309 00:20:15,484 --> 00:20:19,096 Quanto mais a Wikidata estiver integrada nos projetos Wikimedia, 310 00:20:19,096 --> 00:20:22,472 mais as pessoas terão necessidade de falar umas com as outras 311 00:20:22,472 --> 00:20:25,705 acerca dos dados sem que a língua seja a mesma. 312 00:20:25,705 --> 00:20:31,680 Temos de arranjar forma de lidar com isso. 313 00:20:33,276 --> 00:20:36,634 Se alguém tem alguma boa ideia, adoraria falar convosco. 314 00:20:38,790 --> 00:20:41,365 E, com isso, encerro a minha apresentação. 315 00:20:41,618 --> 00:20:44,248 Obrigada a todos, por darem a mais pessoas 316 00:20:44,248 --> 00:20:46,305 acesso a mais conhecimento, todos os dias. 317 00:20:46,305 --> 00:20:53,418 (aplausos) 318 00:20:58,015 --> 00:20:59,902 Temos algum tempo para questões. 319 00:20:59,902 --> 00:21:01,774 Portanto, se alguém na plateia tiver alguma 320 00:21:01,774 --> 00:21:04,975 ou mesmo os que estiverem remotamente a ver a transmissão: Olá mãe. 321 00:21:04,992 --> 00:21:08,072 Podem perguntar no EtherPad 322 00:21:08,072 --> 00:21:11,387 ou no canal do Telegram e faremos o nosso melhor. 323 00:21:11,387 --> 00:21:13,233 Alguma coisa? 324 00:21:15,516 --> 00:21:16,655 Ah. 325 00:21:21,133 --> 00:21:25,208 (plateia 1) Olá a todos. Isto é mais um meme que uma questão. 326 00:21:25,243 --> 00:21:32,341 Então, quando é que a extensão de tempo poderá ter também 327 00:21:32,341 --> 00:21:35,509 horas e minutos e segundos? 328 00:21:35,509 --> 00:21:38,376 Porque, até agora, a posição é apenas de data. 329 00:21:38,376 --> 00:21:41,610 - Eu sei... não é uma pergunta minha. - (risos) 330 00:21:41,610 --> 00:21:44,230 Por isso disse que era um meme. 331 00:21:44,230 --> 00:21:46,093 É assim sempre, 332 00:21:46,093 --> 00:21:48,738 mas vem sempre do remoto, por isso... 333 00:21:50,001 --> 00:21:53,188 Eu não tenho uma boa resposta para isso. 334 00:21:53,188 --> 00:21:54,443 Desculpa. 335 00:21:55,678 --> 00:22:01,636 Mas talvez, no fundo, as pessoas precisem ainda mais disso 336 00:22:01,636 --> 00:22:07,531 para descrever imagens no Commons. Portanto, até pode subir na longa lista 337 00:22:07,531 --> 00:22:11,071 de coisas que precisam de ser feitas com mais rapidez. 338 00:22:14,713 --> 00:22:16,236 Mais alguma questão? 339 00:22:24,686 --> 00:22:27,655 (plateia 2) Linda, da equipa de pesquisa da Fundação Wikimedia. 340 00:22:27,655 --> 00:22:31,080 Tenho uma pergunta acerca do que pensa 341 00:22:31,080 --> 00:22:37,763 sobre patrulhamento e que poderá estar relacionado com a qualidade do conteúdo, 342 00:22:37,803 --> 00:22:39,756 mas pode falar sobre isso. 343 00:22:39,756 --> 00:22:43,542 Como vê, a médio prazo, os esforços de patrulhamento a mudar, 344 00:22:43,542 --> 00:22:45,557 especialmente com o projeto Bridge, 345 00:22:45,559 --> 00:22:48,147 o qual estou muito ansiosa por ir testar. 346 00:22:48,147 --> 00:22:49,903 - Sim, obrigada. - Sim. 347 00:22:52,298 --> 00:22:56,812 Portanto, como diz, com coisas como as que fizemos no Bridge, 348 00:22:58,812 --> 00:23:03,287 muito mais esforço terá que ser dispensado em patrulhamento, penso. 349 00:23:04,362 --> 00:23:08,554 Mas estamos agora com uma dimensão em que, provavelmente, não é exequível 350 00:23:08,554 --> 00:23:10,922 fazê-lo à mão, por humanos. 351 00:23:10,922 --> 00:23:15,090 Portanto, precisamos de um maior esforço em melhorias, por exemplo. 352 00:23:15,090 --> 00:23:18,387 do ORES, o sistema de aprendizagem máquina, para que nos ajude com isso. 353 00:23:18,407 --> 00:23:24,588 Para ajudar-nos a perceber que edições precisam de ser vistas por um humano 354 00:23:24,588 --> 00:23:26,493 e quais são, provavelmente: "Certo, 355 00:23:26,493 --> 00:23:29,792 são coisas normais, não preciso olhar para isto." 356 00:23:33,777 --> 00:23:38,878 Atualmente, o ORES não é muito bom a avaliar o que... 357 00:23:38,878 --> 00:23:41,459 se uma edição na Wikidata é boa ou não. 358 00:23:41,459 --> 00:23:44,549 Existe, atualmente, uma campanha a decorrer 359 00:23:44,549 --> 00:23:50,280 para treinar o sistema de aprendizagem máquina, 360 00:23:51,062 --> 00:23:52,474 com a vossa ajuda. 361 00:23:53,141 --> 00:23:55,550 Para lhe ensinar, basicamente, o que uma boa edição é 362 00:23:55,550 --> 00:23:57,078 e o que uma má edição é. 363 00:23:57,109 --> 00:24:02,774 Ainda não chegámos ao patamar de suficientes humanos o terem ensinado 364 00:24:02,774 --> 00:24:08,025 para realmente o melhorarmos, mas, se tiverem uns minutinhos, 365 00:24:08,025 --> 00:24:11,098 seria bestial que ajudassem a ensinar o ORES 366 00:24:11,098 --> 00:24:13,586 a fazer melhores julgamentos acerca de edições na Wikidata. 367 00:24:13,586 --> 00:24:15,837 E é relativamente simples: ele mostra uma edição 368 00:24:15,842 --> 00:24:17,584 e vocês dizem: "É uma boa edição", 369 00:24:17,584 --> 00:24:19,658 "É uma má edição" e mais nada. 370 00:24:20,041 --> 00:24:23,193 Podem fazer isso sentados no sofá, à noite, em frente da TV. 371 00:24:25,588 --> 00:24:27,021 (plateia 3) Partilhe uma ligação. 372 00:24:28,000 --> 00:24:31,059 Iremos partilhar uma ligação no grupo do Telegram sim. 373 00:24:32,239 --> 00:24:36,239 E, assim que tivermos chegado ao patamar de que precisamos-- 374 00:24:36,239 --> 00:24:39,269 penso que é à volta de 7 000, mas posso estar enganada-- 375 00:24:40,223 --> 00:24:44,359 então, podemos correr o programa de treino novamente e nessa altura será, 376 00:24:44,374 --> 00:24:48,484 esperemos, consideravelmente melhor a julgar as edições na Wikidata. 377 00:24:49,909 --> 00:24:52,063 E, depois, espero que mais de vocês possam usar isso 378 00:24:52,063 --> 00:24:56,029 para filtrar as alterações recentes, por exemplo, na vossa lista 379 00:24:56,029 --> 00:24:58,333 para edições que realmente precisam da vossa atenção. 380 00:24:59,093 --> 00:25:00,227 Sim. 381 00:25:02,639 --> 00:25:04,124 Olá. 382 00:25:04,124 --> 00:25:06,120 [inaudível] 383 00:25:07,116 --> 00:25:09,964 (plateia 4) Estou um pouco curiosa e esta é um pergunta que não é minha, 384 00:25:09,964 --> 00:25:12,729 mas de colegas com quem tenho trabalhado. 385 00:25:12,729 --> 00:25:16,190 Quantos mais parceiros se juntam à Wikidata 386 00:25:16,190 --> 00:25:19,916 e começam a experimentar com consultas, 387 00:25:19,916 --> 00:25:23,079 mais problemas temos com tempos esgotados nas consultas. 388 00:25:23,079 --> 00:25:25,698 Portanto, o que se está a fazer sobre isso? 389 00:25:27,732 --> 00:25:30,170 Então, algumas pessoas na Fundação Wikimedia 390 00:25:30,170 --> 00:25:34,355 estão a analisar isso e-- pequena indiscrição-- 391 00:25:34,355 --> 00:25:36,988 estejam na sessão do presente de aniversário. 392 00:25:36,988 --> 00:25:39,221 (risos) 393 00:25:43,384 --> 00:25:46,201 (Bart) Olá, sou Bart Magnus do PACKED Bélgica. 394 00:25:46,201 --> 00:25:48,620 Gostaria de saber se sabe em que estado estão 395 00:25:48,620 --> 00:25:52,115 as federações, ou seja, reutilizar as tuas propriedades 396 00:25:52,115 --> 00:25:53,752 na tua própria instância da Wikibase. 397 00:25:53,752 --> 00:25:56,887 Há algo que queria mencionar em relação a isso? 398 00:25:56,898 --> 00:26:01,425 Então, ao longo do último ano, muitas pessoas nos têm dito 399 00:26:01,425 --> 00:26:03,996 que querem a federação, certo? 400 00:26:03,996 --> 00:26:06,746 Mas o problema era que muitas pessoas tinham 401 00:26:06,746 --> 00:26:09,318 várias ideias diferentes do que significava federação. 402 00:26:10,566 --> 00:26:13,533 Algumas dessas coisas eram facilmente executáveis. 403 00:26:13,533 --> 00:26:15,664 Outras eram realmente muito difíceis. 404 00:26:16,934 --> 00:26:22,148 E a minha equipa e eu temos falado com muitas pessoas, por exemplo, 405 00:26:22,148 --> 00:26:27,193 os parceiros com quem trabalhamos nas bibliotecas, para ver se concluíamos 406 00:26:27,193 --> 00:26:28,836 precisamente o que precisavam. 407 00:26:30,111 --> 00:26:33,893 E terminámos isso agora. Embora, claro, esteja disponível 408 00:26:33,893 --> 00:26:37,850 para receber mais comentários se quiserem falar comigo sobre isso. 409 00:26:37,850 --> 00:26:41,397 Estou agora numa fase onde confortavelmente digo: 410 00:26:41,397 --> 00:26:43,480 "Certo, vamos começar com isto." 411 00:26:44,606 --> 00:26:48,197 E diria que nos próximos dois ou três meses 412 00:26:48,197 --> 00:26:51,243 vamos escrever as primeiras linhas de código. 413 00:26:51,243 --> 00:26:53,793 Depois, se tudo correr bem, tê-lo-emos pronto para as pessoas 414 00:26:53,793 --> 00:26:56,533 o testarem, diria que no início do próximo ano. 415 00:26:59,661 --> 00:27:01,023 (moderador) Últimas questões. 416 00:27:02,147 --> 00:27:05,603 (Finn) Finn Årup Nielsen de Copenhaga, Dinamarca. 417 00:27:05,973 --> 00:27:09,833 Em relação à outra linguagem, tem havido muita discussão, digamos, 418 00:27:09,833 --> 00:27:13,617 na comunidade WikiCite acerca de se devemos continuar 419 00:27:13,617 --> 00:27:15,745 a colocar mais trabalhos científicos ali. 420 00:27:15,745 --> 00:27:19,913 Isto está relacionado com quandos dados podemos nós colocar na Wikidata. 421 00:27:19,913 --> 00:27:23,032 Tempos esgotados no Wikidata Query Service é uma das questões, 422 00:27:23,032 --> 00:27:24,468 mas também a manutenção. 423 00:27:24,468 --> 00:27:30,300 Portanto, o que pensa acerca... 424 00:27:31,060 --> 00:27:35,173 O tamanho da Wikidata está a começar a ser um problema, 425 00:27:35,173 --> 00:27:36,237 no geral? 426 00:27:36,237 --> 00:27:38,666 Devemos parar de colocar dados nos lexemas? 427 00:27:38,666 --> 00:27:41,222 Devemos parar de colocar dados científicos 428 00:27:41,222 --> 00:27:45,717 na Wikidata ou temos alguma pesquisa sobre isto 429 00:27:45,717 --> 00:27:50,053 ou estão a inflacionar os problemas técnicos? 430 00:27:50,292 --> 00:27:51,445 Sim... 431 00:27:53,266 --> 00:27:57,419 A Wikidata está definitivamente a chegar a algumas... 432 00:27:58,906 --> 00:28:02,732 fronteiras de escalabilidade, digamos, 433 00:28:03,740 --> 00:28:05,975 tanto técnica como socialmente. 434 00:28:05,975 --> 00:28:09,197 E, para ambas, precisamos de soluções, certo? 435 00:28:09,197 --> 00:28:12,518 Socialmente, temos por exemplo mais editores 436 00:28:12,518 --> 00:28:15,689 e mudanças recentes, até ao ponto em que é completamente inviável 437 00:28:15,689 --> 00:28:19,623 a um humano patrulhar isso porque é pura e simplesmente demais. 438 00:28:21,246 --> 00:28:26,205 Mas também tecnicamente e temos tentado resolver isso também. 439 00:28:26,205 --> 00:28:29,958 Por exemplo, re-arquiteturando a base de dados 440 00:28:29,958 --> 00:28:32,278 à volta de tabelas de BD viradas para a visualização, 441 00:28:32,278 --> 00:28:35,309 se é que isto vos diz algo. 442 00:28:35,900 --> 00:28:38,366 Mas isso só nos leva até determinado ponto 443 00:28:38,516 --> 00:28:41,343 e uma das coisas que queremos ver no próximo ano 444 00:28:41,343 --> 00:28:45,968 é onde estão os outros pontos difíceis e o que fazer com eles 445 00:28:45,968 --> 00:28:47,585 no aspeto técnico. 446 00:28:49,085 --> 00:28:50,728 Portanto, esse é o quadro geral. 447 00:28:50,728 --> 00:28:54,455 Ao mesmo tempo, fico muito hesitante 448 00:28:54,455 --> 00:28:58,387 em dizer a alguém, "Não, não, não. Para de inserir dados na Wikidata." 449 00:28:58,738 --> 00:29:00,090 (risos) 450 00:29:00,090 --> 00:29:02,408 Isso vai um pouco contra o propósito da coisa. 451 00:29:04,311 --> 00:29:07,061 Mas, por exemplo, o ecosistema Wikibase 452 00:29:07,061 --> 00:29:09,220 é uma forma de tentar resolver isso 453 00:29:09,220 --> 00:29:13,952 sem requerer nada da Wikidata. 454 00:29:13,952 --> 00:29:16,267 Essa é a beleza de um sistema aberto de dados ligados. 455 00:29:16,267 --> 00:29:18,298 Não temos de ter tudo no mesmo sítio. 456 00:29:18,298 --> 00:29:20,582 Podemos ligar-nos a vários sítios. É espantoso. 457 00:29:21,957 --> 00:29:28,309 Portanto, de volta à WikiCites em específico, sim... 458 00:29:29,294 --> 00:29:34,358 Certo, a WikiCites em específico. Eu penso que precisamos 459 00:29:34,358 --> 00:29:36,196 de olhar para isso proporcionalmente. 460 00:29:36,196 --> 00:29:40,548 Não tenho uma percentagem exata de qual a quantidade 461 00:29:40,548 --> 00:29:44,381 de items da Wikidata que estão à volta de tópicos da WikiCites, 462 00:29:44,381 --> 00:29:46,606 mas é uma grande percentagem. 463 00:29:46,606 --> 00:29:49,869 E talvez seja isso que precisamos de discutir... 464 00:29:50,356 --> 00:29:52,442 Durante a pausa. 465 00:29:53,191 --> 00:29:54,616 Muito obrigado! 466 00:29:54,616 --> 00:30:01,689 (aplausos)