1
00:00:06,180 --> 00:00:08,410
Olá a todos.
2
00:00:08,410 --> 00:00:11,636
É espantoso ter-vos a todos aqui
e serem tantos.
3
00:00:11,647 --> 00:00:13,298
É mesmo, mesmo ótimo.
4
00:00:14,659 --> 00:00:19,541
Então, a Lea já falou muito
sobre este evento.
5
00:00:19,541 --> 00:00:22,875
Eu vou falar um pouco
sobre a Wikidata propriamente dita
6
00:00:22,875 --> 00:00:26,255
e o que lhe tem estado a acontecer
durante o último ano
7
00:00:26,255 --> 00:00:28,151
e para onde estamos a ir.
8
00:00:28,663 --> 00:00:32,974
Então... o que é isto? Desculpem.
9
00:00:40,118 --> 00:00:44,329
Então... onde estamos?
Para onde estamos a ir?
10
00:00:44,950 --> 00:00:49,680
Ao longo do último ano
houve muito para celebrar
11
00:00:49,680 --> 00:00:52,329
e queria salientar algumas dessas coisas
12
00:00:52,329 --> 00:00:55,125
porque às vezes passam despercebidas.
13
00:00:56,855 --> 00:01:03,864
E, em primeiro lugar, quero rever convosco
algumas estatísticas de editores,
14
00:01:03,865 --> 00:01:07,119
o nosso conteúdo
e como os nossos dados são usados.
15
00:01:10,376 --> 00:01:14,976
Ao longo do último ano
a nossa comunidade cresceu
16
00:01:14,976 --> 00:01:16,720
o que é espantoso.
17
00:01:16,724 --> 00:01:21,248
Temos, aproximadamente, 3000 pessoas novas
18
00:01:21,248 --> 00:01:25,963
que editam uma vez ou mais a cada 30 dias.
19
00:01:26,133 --> 00:01:30,176
Portanto, isso são mais de
3000 Wikidatans novos!
20
00:01:30,176 --> 00:01:31,617
(risos)
21
00:01:31,617 --> 00:01:36,544
Agora, se olharem para os que fazem mais,
por exemplo cinco edições a cada 30 dias,
22
00:01:36,544 --> 00:01:40,727
temos mais aproximadamente 1 200.
23
00:01:40,995 --> 00:01:44,202
E se olharem para as pessoas
que fazem 100 edições ou mais--
24
00:01:44,202 --> 00:01:47,366
espero que muitos dos que aqui estão--
25
00:01:47,366 --> 00:01:48,996
temos mais 300.
26
00:01:49,277 --> 00:01:51,450
Levantem a mão se estiverem neste grupo.
27
00:01:52,733 --> 00:01:56,049
Vocês são demais!
28
00:01:58,059 --> 00:02:00,906
E enquanto...
29
00:02:00,906 --> 00:02:06,016
o número de edições
não é algo a que normalmente
30
00:02:06,016 --> 00:02:08,592
prestemos muita atenção,
31
00:02:08,592 --> 00:02:12,683
nós acabamos por ultrapassar a marca
dos mil milhões de edições este ano.
32
00:02:12,967 --> 00:02:19,087
(aplausos)
33
00:02:21,347 --> 00:02:23,224
Vamos, então, olhar para o conteúdo.
34
00:02:27,610 --> 00:02:31,222
Então, estamos agora
com 65 milhões de items,
35
00:02:31,462 --> 00:02:34,093
portanto, entidades para descrever o mundo
36
00:02:34,093 --> 00:02:40,541
e estamos a fazê-lo com, aproximadamente,
6 700 propriedades.
37
00:02:43,667 --> 00:02:48,079
Dessas, à volta de 4 300
são identificadores externos,
38
00:02:48,079 --> 00:02:53,328
o que nos dá muitas ligações
a outros catálogos, bases de dados,
39
00:02:53,328 --> 00:02:55,607
websites e mais
40
00:02:55,927 --> 00:02:59,024
e realmente fazem da Wikidata
um lugar central
41
00:02:59,024 --> 00:03:01,594
numa rede aberta ligada de dados.
42
00:03:02,453 --> 00:03:07,241
Então, usando essas propriedades e items,
43
00:03:07,241 --> 00:03:11,990
temos agora perto de
800 milhões de declarações
44
00:03:11,990 --> 00:03:15,892
e comparado com o ano passado,
sabemos mais meia declaração
45
00:03:15,892 --> 00:03:18,365
acerca de cada um dos items.
46
00:03:18,365 --> 00:03:20,480
(risos)
47
00:03:22,595 --> 00:03:25,144
Então, sim, a Wikidata ficou mais esperta.
48
00:03:26,914 --> 00:03:29,724
Mas não temos apenas items
e propriedades,
49
00:03:29,724 --> 00:03:33,854
também temos coisas novas
como os lexemas.
50
00:03:33,866 --> 00:03:39,825
Temos agora 204 000 lexemas
que descrevem palavras
51
00:03:39,825 --> 00:03:41,860
em muitas linguagens diferentes.
52
00:03:41,939 --> 00:03:43,241
É muito fixe.
53
00:03:43,668 --> 00:03:47,661
Vou falar mais sobre isto
numa outra sessão mais tarde.
54
00:03:48,860 --> 00:03:52,690
Por último, a mais recente adição
são esquemas de entidades
55
00:03:52,690 --> 00:03:58,503
que nos ajudam a descobrir como modelar,
consistentemente, modelos de dados
56
00:03:58,503 --> 00:04:00,971
ao longo de determinadas áreas.
57
00:04:02,171 --> 00:04:04,552
E, desses, temos aproximadamente 140.
58
00:04:07,571 --> 00:04:11,432
Mas números não são tudo
em relação ao conteúdo, certo--
59
00:04:11,432 --> 00:04:14,697
quantidade de conteúdo--
também nos importa a qualidade do mesmo.
60
00:04:15,613 --> 00:04:21,976
E o que fizemos agora foi treinar um
sistema de aprendizagem máquina
61
00:04:21,976 --> 00:04:25,287
para avaliar a qualidade de qualquer item.
62
00:04:25,822 --> 00:04:29,531
Isto está longe de ser perfeito,
mas já vos dá uma ideia.
63
00:04:29,916 --> 00:04:35,011
Portanto, cada item na Wikidata
recebe um resultado entre 1 e 5.
64
00:04:35,011 --> 00:04:37,895
Um é mesmo terrível,
cinco é extraordinário.
65
00:04:38,446 --> 00:04:41,901
E ele olha para coisas
como quantas declarações tem,
66
00:04:41,901 --> 00:04:44,031
quantos identificadores externos tem,
67
00:04:44,031 --> 00:04:45,922
quantas referências estão lá,
68
00:04:45,922 --> 00:04:49,414
quantas etiquetas diferentes temos
em quantas línguas diferentes
69
00:04:49,414 --> 00:04:50,604
e assim por diante.
70
00:04:50,727 --> 00:04:55,118
E, depois, olhamos
para a Wikidata ao longo do tempo
71
00:04:55,118 --> 00:04:59,751
e, como podem ver,
com base nestas medidas
72
00:04:59,751 --> 00:05:03,918
fomos de verdadeiramente terríveis
a bem melhores.
73
00:05:03,918 --> 00:05:05,238
(risos)
74
00:05:05,649 --> 00:05:07,068
Logo, é bom.
75
00:05:07,303 --> 00:05:11,961
Mas, o que também conseguimos ver
é que ainda falta muito para o cinco.
76
00:05:11,961 --> 00:05:13,312
(risos)
77
00:05:13,664 --> 00:05:20,171
Eu não penso que seja aqui
que chegaremos, certo?
78
00:05:20,171 --> 00:05:23,263
Nem todos os items vão estar
absolutamente perfeitos
79
00:05:23,266 --> 00:05:26,087
de acordo com o que temos medido.
80
00:05:26,354 --> 00:05:29,169
Mas estou realmente contente por ver
que, consistentemente,
81
00:05:29,169 --> 00:05:32,387
a qualidade dos dados está a melhorar.
82
00:05:36,709 --> 00:05:43,111
Mas criar dados não é suficiente.
83
00:05:44,428 --> 00:05:46,734
Queremos que isto...
fazemos isto por uma razão.
84
00:05:46,734 --> 00:05:48,749
Queremos que sejam usados.
85
00:05:48,749 --> 00:05:55,450
E, agora, olhámos
para a quantidade de artigos
86
00:05:55,450 --> 00:06:00,770
noutros projetos da Wikmedia
que usam dados da Wikidata
87
00:06:02,040 --> 00:06:06,762
e olhámos para a percentagem
de todos os artigos nesses projetos.
88
00:06:07,395 --> 00:06:09,554
Se olharmos
para todo o espetro da Wikimedia
89
00:06:09,554 --> 00:06:11,989
e para todos os artigos que existem,
90
00:06:11,989 --> 00:06:18,768
então, hoje, 56,35% de todos
usam alguns dados da Wikidata.
91
00:06:20,054 --> 00:06:21,815
O que eu considero muito bom,
92
00:06:21,815 --> 00:06:27,378
mas claro que ainda há muito que andar
para chegarmos aos 100%.
93
00:06:29,085 --> 00:06:33,811
E depois, eu olho para quais os projetos
que realmente estao a fazer maior uso
94
00:06:33,811 --> 00:06:36,188
dos dados da Wikidata
95
00:06:36,188 --> 00:06:39,401
e divido isto por versões de linguagem
e assim por diante.
96
00:06:39,606 --> 00:06:44,997
E, agora, o que é que pensam que
os cinco primeiros projetos...
97
00:06:45,577 --> 00:06:48,254
quais deles são todos?
98
00:06:48,254 --> 00:06:50,834
A que família de projetos pertencem?
99
00:06:51,036 --> 00:06:53,177
(algumas vozes na audiência) Commons.
100
00:06:53,177 --> 00:06:56,607
Certo. Commons é mais ou menos geral.
101
00:06:57,216 --> 00:06:58,903
Na verdade, estariam enganados.
102
00:06:58,903 --> 00:07:01,684
Todos os cinco primeiros
são da Wikivoyage.
103
00:07:02,084 --> 00:07:03,650
(plateia) Oh!
104
00:07:03,692 --> 00:07:05,044
(risos)
105
00:07:05,439 --> 00:07:08,345
Portanto, sim,
um aplauso para a Wikivoyage.
106
00:07:08,345 --> 00:07:13,773
(aplausos)
107
00:07:16,710 --> 00:07:20,383
Se querem saber onde os Commons estão
108
00:07:20,383 --> 00:07:22,053
e onde estão todos os vossos projetos,
109
00:07:22,053 --> 00:07:23,521
há um painel de controlo.
110
00:07:23,521 --> 00:07:26,083
Venham comigo
e vamos dar uma vista de olhos.
111
00:07:28,049 --> 00:07:32,016
Claro, os nossos dados não são usados
só dentro da Wikimedia.
112
00:07:32,016 --> 00:07:34,606
Também são usados fora
e aconteceu tanto.
113
00:07:34,966 --> 00:07:39,256
Eu não posso mencioná-los a todos,
mas para salientar alguns
114
00:07:39,518 --> 00:07:44,028
que são os maiores utilizadores dos nossos
dados: o Met, o Fundo Wellcome,
115
00:07:44,030 --> 00:07:45,687
a Livraria do Congresso,
116
00:07:45,687 --> 00:07:47,848
o GeneWiki e muitos muitos mais.
117
00:07:47,951 --> 00:07:51,296
E, se assistirem a algumas apresentações
que estão mais tarde no programa,
118
00:07:51,296 --> 00:07:53,292
vão ouvir falar de alguns deles.
119
00:07:56,635 --> 00:07:59,608
Certo, chega de estatísticas.
120
00:07:59,807 --> 00:08:02,171
Vamos salientar aqui outros pontos.
121
00:08:02,644 --> 00:08:06,897
Portanto, já falámos
sobre a melhoria da qualidade dos dados
122
00:08:06,897 --> 00:08:10,646
e, quando vemos a qualidade dos dados,
há muitas dimensões
123
00:08:10,646 --> 00:08:16,426
para onde podemos olhar
e podemos melhorar algumas delas,
124
00:08:16,482 --> 00:08:18,980
tal como quão fiáveis são,
125
00:08:18,980 --> 00:08:20,751
quão confiáveis são,
126
00:08:20,751 --> 00:08:22,515
quão referenciados estão,
127
00:08:22,515 --> 00:08:24,865
quão consistentemente são modelados,
128
00:08:26,351 --> 00:08:28,992
quão completos estão e assim por diante.
129
00:08:31,263 --> 00:08:35,746
Só para escolher um...
para a consistência por exemplo,
130
00:08:35,746 --> 00:08:42,355
criámos a capacidade de guardar
esquemas de entidades na Wikidata
131
00:08:42,355 --> 00:08:46,553
para que possam descrever
como certos domínios devem ser modelados.
132
00:08:46,736 --> 00:08:49,172
Para que possam encontrar...
133
00:08:49,557 --> 00:08:53,902
Podem criar um esquema de entidade,
digamos, pintores Holandeses
134
00:08:53,902 --> 00:08:56,492
e depois podem verificar como...
135
00:08:56,492 --> 00:08:59,359
que items que são para pintores Holandeses
136
00:08:59,359 --> 00:09:02,470
não têm, por exemplo,
uma data de nascimento, mas que deviam
137
00:09:02,470 --> 00:09:05,235
e coisas desse género.
138
00:09:05,557 --> 00:09:10,011
E espero que muitos mais
projetos wiki e outros
139
00:09:10,011 --> 00:09:13,291
possam fazer melhor uso
dos esquemas de entidades para tratarem
140
00:09:13,291 --> 00:09:15,925
os seus dados.
Se quiserem aprender como fazê-lo,
141
00:09:15,925 --> 00:09:18,055
vai haver também
uma sessão mais tarde
142
00:09:18,055 --> 00:09:22,892
de pessoas que sabem tudo sobre isto
e que farão disto um
143
00:09:22,892 --> 00:09:24,858
mistério menor.
144
00:09:27,575 --> 00:09:28,745
Muito bem.
145
00:09:30,899 --> 00:09:34,701
Outra coisa que realmente ganhou tração
146
00:09:34,774 --> 00:09:37,867
no último ano
foi o ecossistema Wikibase, certo?
147
00:09:37,867 --> 00:09:44,015
Esta ideia que nem todos os dados abertos
devem e têm que estar
148
00:09:44,015 --> 00:09:47,490
na Wikidata mas que, em vez disso,
queremos ter um ecossistema vibrante
149
00:09:47,490 --> 00:09:51,151
de diferentes lugares,
com diferentes agentes,
150
00:09:51,151 --> 00:09:53,513
como instituições, companhias,
151
00:09:53,513 --> 00:09:56,929
programas de voluntariado que divulguem
os seus dados da mesma forma
152
00:09:56,929 --> 00:10:00,372
que a Wikidata faz
e depois ligarmos tudo isto,
153
00:10:00,372 --> 00:10:03,317
trocando dados entre eles,
ligando esses dados.
154
00:10:04,282 --> 00:10:08,808
E, ao longo do último ano,
o interesse nisto
155
00:10:08,808 --> 00:10:11,760
e o interesse nas instituições
e nas pessoas que dirigem
156
00:10:11,760 --> 00:10:14,977
as suas próprias instâncias baseadas
em Wiki, realmente explodiu,
157
00:10:14,977 --> 00:10:20,466
especialmente no setor das bibliotecas.
158
00:10:23,009 --> 00:10:26,210
Há muitos testes, avaliações,
159
00:10:26,226 --> 00:10:28,787
e para ser honesta, pioneirismo
160
00:10:28,787 --> 00:10:33,536
a acontecer neste momento,
quando instituições aventureiras
161
00:10:33,536 --> 00:10:38,872
trabalham connosco para descobrir
como a Wikibase pode funcionar
162
00:10:38,872 --> 00:10:42,243
para as suas coleções,
os seus catálogos e assim por diante.
163
00:10:42,539 --> 00:10:45,024
Entre elas, a Biblioteca Nacional Alemã,
164
00:10:45,024 --> 00:10:46,419
a Biblioteca Nacional Francesa,
165
00:10:46,419 --> 00:10:49,194
OCLC e, claro, isso é muito entusiasmante.
166
00:10:55,278 --> 00:10:57,360
Uma das razões porque penso isso
167
00:10:57,360 --> 00:11:02,868
é que estamos a ajudar essas instituições
a abrir os seus dados de uma forma que
168
00:11:02,868 --> 00:11:07,914
não é só colocá-los num site
onde alguém pode acessá-los
169
00:11:07,926 --> 00:11:11,947
mas realmente a pensar sobre isto,
no próximo passo depois disto, certo?
170
00:11:11,947 --> 00:11:15,229
Deixar que as pessoas ajudem a manter
os dados, melhorá-los,
171
00:11:15,229 --> 00:11:20,449
enriquecê-los e isso é uma viragem
172
00:11:20,450 --> 00:11:24,526
que eu espero
que traga muitas coisas boas.
173
00:11:26,041 --> 00:11:27,859
E a outra coisa com a qual nos ajuda
174
00:11:27,859 --> 00:11:31,203
é que deixa os especialistas
curarem os dados
175
00:11:31,203 --> 00:11:37,474
no seu espaço, mantê-los em bom estado
para que possamos implementar
176
00:11:37,474 --> 00:11:42,317
processos de sincronização
com a Wikidata, por exemplo.
177
00:11:42,317 --> 00:11:45,604
Em vez de, permanentemente,
estarmos nós a fazermos isso.
178
00:11:46,519 --> 00:11:50,223
E, no final do dia,
espero que tire alguma pressão
179
00:11:50,223 --> 00:11:53,776
de cima da Wikidata, para ser aquele lugar
onde tudo tem que ir parar.
180
00:11:58,040 --> 00:12:00,450
Dados lexicográficos.
181
00:12:01,962 --> 00:12:06,997
Ao longo do último ano,
as pessoas começaram a descrever palavras,
182
00:12:06,997 --> 00:12:12,264
na sua língua, na Wikidata
para que se possam construir coisas
183
00:12:12,264 --> 00:12:14,713
como ferramentas automatizadas
de tradução.
184
00:12:16,413 --> 00:12:21,019
E estamos num ponto
em que, em algumas línguas,
185
00:12:21,019 --> 00:12:25,500
estamos a começar a chegar perto
de atingir essa massa crítica
186
00:12:25,500 --> 00:12:29,143
que é precisa para realmente
construir uma aplicação séria.
187
00:12:29,527 --> 00:12:32,614
Em muitas línguas
ainda temos um longo caminho a percorrer,
188
00:12:32,614 --> 00:12:35,411
mas noutras
começamos mesmo a chegar lá
189
00:12:35,411 --> 00:12:37,265
e isso é realmente ótimo de se ver.
190
00:12:38,621 --> 00:12:41,430
Se quiserem saber mais,
venham à minha apresentação mais tarde.
191
00:12:46,064 --> 00:12:48,954
E, obviamente, não podemos esquecer
192
00:12:48,954 --> 00:12:50,955
dados estruturados nos Commons.
193
00:12:51,150 --> 00:12:52,384
(membro da plateia assobia)
194
00:12:52,384 --> 00:12:54,052
Sim! (risos)
195
00:12:54,056 --> 00:12:59,324
(aplausos)
196
00:12:59,324 --> 00:13:01,515
Os dados estruturados nos Commons
que vimos na fundação
197
00:13:01,515 --> 00:13:05,571
realmente juntaram...
198
00:13:07,121 --> 00:13:11,459
tudo e tornaram possível
199
00:13:11,459 --> 00:13:15,479
adicionar declarações a ficheiros
nos Commons ao longo do último ano.
200
00:13:15,479 --> 00:13:18,586
E as pessoas começaram a adicionar
essas declarações a imagens
201
00:13:18,586 --> 00:13:22,770
para as tornarem mais fáceis de encontrar,
para se construirem melhores aplicações
202
00:13:22,770 --> 00:13:24,292
com base nelas e muito mais.
203
00:13:24,292 --> 00:13:26,852
É realmente excitante
ver como está a crescer.
204
00:13:26,852 --> 00:13:29,988
O que é realmente importante
205
00:13:29,988 --> 00:13:32,959
para a comunidade Wikidata
perceber aqui
206
00:13:32,959 --> 00:13:36,555
é que, quando vemos "retratos"
207
00:13:36,555 --> 00:13:41,577
ou "gato de casa" ou "sentar", "lagarto"
ou "parede", aqui,
208
00:13:41,577 --> 00:13:44,867
isso são ligações a items da Wikidata
e propriedades.
209
00:13:45,425 --> 00:13:49,620
Isso significa que quando criamos
items e propriedades,
210
00:13:49,620 --> 00:13:54,031
eles já não estão só a providenciar
o vocabulário para a própria Wikidata.
211
00:13:54,031 --> 00:13:57,749
Estão a providenciar o vocabulário
para os Commons também.
212
00:13:57,904 --> 00:14:00,695
E isto irá ser cada vez mais assim.
213
00:14:00,695 --> 00:14:02,929
Portanto, temos de prestar muita atenção
214
00:14:02,929 --> 00:14:06,550
a como a nossa ontologia,
o nosso vocabulário
215
00:14:06,550 --> 00:14:09,777
é na realidade usado em mais sítios
do que tínhamos antes.
216
00:14:13,589 --> 00:14:19,905
E o último que tenho é que começamos a
construir pontes mais sólidas
217
00:14:19,905 --> 00:14:21,902
para os outros projetos da Wikimedia.
218
00:14:23,281 --> 00:14:26,159
A minha equipa e eu estamos a trabalhar
no projeto Wikidata Bridge
219
00:14:26,159 --> 00:14:28,849
e vocês devem mesmo
vir à cabina da interface
220
00:14:28,849 --> 00:14:32,904
e fazer uns teste do estado atual.
221
00:14:32,904 --> 00:14:36,240
Teremos lá alguns editores de Wikipédia
222
00:14:36,240 --> 00:14:38,970
a editar a Wikidata diretamente
a partir dos seus projetos,
223
00:14:38,976 --> 00:14:40,988
sem terem de ir à Wikidata
224
00:14:40,988 --> 00:14:43,958
e sem terem de perceber tudo sobre ela.
225
00:14:43,958 --> 00:14:50,571
Espero que isto remova mais uma
das dificuldades que tornam difícil
226
00:14:50,571 --> 00:14:54,498
que projetos da Wikimedia
adotem mais dados da Wikidata.
227
00:14:57,165 --> 00:15:01,012
Muito bem, agora as estratégias
e para onde estamos a ir.
228
00:15:03,005 --> 00:15:07,179
Desde Dezembro, a equipa da Wikidata
na Wikimedia Alemanha
229
00:15:07,179 --> 00:15:12,262
e pessoal da Fundação Wikimedia
têm estado a trabalhar em estratégias,
230
00:15:12,262 --> 00:15:14,675
papéis relacionados com a Wikidata.
231
00:15:14,675 --> 00:15:16,101
É, basicamente, colocar no papel
232
00:15:16,101 --> 00:15:19,526
o que muitos de nós
andamos a falar
233
00:15:19,526 --> 00:15:22,958
ao longo dos últimos quatro ou cinco anos.
234
00:15:23,995 --> 00:15:29,492
E não sei se leram esses trabalhos.
235
00:15:29,492 --> 00:15:33,757
Eles estão publicados no Meta Commons
até ao final do mês.
236
00:15:33,757 --> 00:15:35,806
Seria ótimo,
se ainda não os tiverem lido,
237
00:15:35,806 --> 00:15:39,019
que os lessem,
deixassem os vossos comentários, etc.
238
00:15:40,062 --> 00:15:44,338
Agora, uma muito rápida revisão
sobre o que está lá,
239
00:15:44,338 --> 00:15:50,991
é que pensamos sobre a Wikidata
e a Wikibase em três partes.
240
00:15:51,506 --> 00:15:55,442
Primeiro, a Wikidata como plataforma.
241
00:15:55,442 --> 00:15:57,023
Podem vê-la no canto inferior.
242
00:15:57,301 --> 00:16:03,876
Isso anda, na realidade, à volta
da Wikidata permitir a cada pessoa
243
00:16:03,876 --> 00:16:06,273
aceder e partilhar informação
244
00:16:06,273 --> 00:16:09,038
independentemente da sua linguagem
e tecnologia.
245
00:16:09,038 --> 00:16:14,479
Fazemos isso providenciando
dados de interesse geral sobre o mundo.
246
00:16:14,479 --> 00:16:18,161
Então, basicamente,
é o que vocês fazem todos os dias.
247
00:16:21,282 --> 00:16:25,497
Em segundo, está a parte
do ecossistema Wikibase,
248
00:16:25,497 --> 00:16:30,047
onde a Wikibase, o software
que suporta a Wikidata, alimenta
249
00:16:30,047 --> 00:16:34,993
não apenas a Wikidata, mas uma vibrante
rede de dados abertos, a espinha dorsal
250
00:16:35,008 --> 00:16:36,817
de um conhecimento aberto, livre e grátis.
251
00:16:38,126 --> 00:16:43,005
Em terceiro e último está a Wikidata
para os projetos Wikimedia, no topo.
252
00:16:43,005 --> 00:16:47,011
Onde a Wikidata está
253
00:16:47,011 --> 00:16:49,594
para ajudar os projetos Wikimedia...
254
00:16:50,750 --> 00:16:53,559
ajudá-los a estarem preparados
para o futuro.
255
00:16:57,597 --> 00:17:02,973
Concretamente, o que isso significa
para o futuro próximo ou médio?
256
00:17:03,898 --> 00:17:06,235
A Wikidata como plataforma.
257
00:17:06,669 --> 00:17:10,700
Temos de ter melhor qualidade dos dados,
portanto continuaremos a trabalhar
258
00:17:10,700 --> 00:17:14,195
em melhores ferramentas, em melhorar
as que temos e assim por diante.
259
00:17:14,633 --> 00:17:18,899
Temos de tornar os nossos dados
mais acessíveis
260
00:17:18,899 --> 00:17:23,864
através de melhores APIs,
parâmetros finais SPARQL mais robustos,
261
00:17:23,864 --> 00:17:27,315
mas também coisas como modelar os dados
com mais consistência
262
00:17:27,315 --> 00:17:31,235
para que, na realidade, seja mais fácil
reutilizá-los em aplicações.
263
00:17:31,867 --> 00:17:37,203
E a última coisa
seria estabelecer processos de feedback
264
00:17:37,203 --> 00:17:38,769
com os nossos parceiros.
265
00:17:40,399 --> 00:17:43,905
Ao contrário da Wikipédia, a Wikidata não
266
00:17:43,905 --> 00:17:46,142
é o que costumo
chamar um projeto destino, certo?
267
00:17:46,142 --> 00:17:49,166
Alguém vai à Wikipédia e lê algo
268
00:17:49,166 --> 00:17:50,852
enquanto, na Wikidata, o processo não é:
269
00:17:50,852 --> 00:17:53,295
alguém vai à Wikidata e lê algo.
270
00:17:53,295 --> 00:17:54,309
Seria ótimo,
271
00:17:54,309 --> 00:17:57,834
mas, realisticamente,
não é isso a Wikidata é, certo?
272
00:17:57,882 --> 00:18:00,520
As pessoas que estão expostas
273
00:18:00,520 --> 00:18:02,719
aos nossos dados
não estão na Wikidata propriamente,
274
00:18:02,770 --> 00:18:06,838
mas estão a ver o que querem através
da Wikipédia e de outros sítios.
275
00:18:07,547 --> 00:18:12,238
Agora, esses outros sítios
recebem comentários sobre os dados, certo?
276
00:18:12,238 --> 00:18:14,635
Os utilizadores dizem-lhes,
"Isto está errado".
277
00:18:16,775 --> 00:18:20,952
Eu gostava de ter isso
para que pudessemos torná-lo disponível
278
00:18:20,958 --> 00:18:24,179
às pessoas que realmente editam
na Wikidata, ou seja vocês.
279
00:18:24,374 --> 00:18:27,212
E descobrir como fazer isso
de uma forma robusta,
280
00:18:27,212 --> 00:18:31,679
sem sobrecarregar toda a gente,
será um dos objetivos a atingir
281
00:18:31,679 --> 00:18:33,143
durante o próximo ano.
282
00:18:34,623 --> 00:18:37,127
Ecossistema Wikibase.
283
00:18:37,127 --> 00:18:40,925
Ali, continuaremos a trabalhar
com as bibliotecas,
284
00:18:40,925 --> 00:18:46,192
mas também a olhar para as ciências,
por exemplo, e mais ainda.
285
00:18:46,192 --> 00:18:51,641
Vai haver uma apresentação Wikibase
mais logo e vocês deviam todos ir
286
00:18:51,641 --> 00:18:52,951
e ver o que já lá está
287
00:18:52,961 --> 00:18:55,792
e o que as pessoas estão já a fazer
com a Wikibase.
288
00:18:55,792 --> 00:18:57,281
Vale mesmo a pena.
289
00:18:57,682 --> 00:19:00,832
E o que é preciso lá
290
00:19:00,832 --> 00:19:03,181
é também montar
bons processos em torno disso.
291
00:19:04,384 --> 00:19:08,138
Ajudar as pessoas a descobrir
com quem falar sobre o quê,
292
00:19:08,138 --> 00:19:10,467
onde podem encontrar ajuda,
293
00:19:10,467 --> 00:19:11,831
todo esses tipos de coisas.
294
00:19:13,474 --> 00:19:17,395
E, claro, facilitar
a instalação e manutenção
295
00:19:17,395 --> 00:19:20,309
da Wikibase, porque ainda é
uma séria dor de cabeça.
296
00:19:21,144 --> 00:19:24,617
E, por último, temos federação,
que basicamente é
297
00:19:24,617 --> 00:19:27,245
o que falamos para os Commons,
298
00:19:27,245 --> 00:19:30,704
onde os Commons usam items e propriedades
da Wikidata
299
00:19:30,704 --> 00:19:33,514
mas para outras instâncias da Wikibase
300
00:19:33,514 --> 00:19:36,488
para que eles também possam usar
o vocabulário da Wikidata.
301
00:19:37,742 --> 00:19:42,107
E isso, como estava a dizer anteriormente,
aumenta outra vez
302
00:19:42,107 --> 00:19:48,228
a necessidade de ter consciência
de como o vocabulário é utilizado lá fora,
303
00:19:48,228 --> 00:19:51,055
mais do que tivemos até agora.
304
00:19:53,792 --> 00:19:56,556
E a Wikidata para projetos da Wikimedia.
305
00:19:56,972 --> 00:20:00,580
Integração mais estreita
através da Wikidata Bridge
306
00:20:00,580 --> 00:20:04,154
e ajudar pessoas a editar diretamente
a partir dos seus projetos.
307
00:20:04,154 --> 00:20:08,999
E a outra questão em que todos precisamos
pensar juntos,
308
00:20:08,999 --> 00:20:14,684
é descobrir como reduzir
as barreiras de linguagem.
309
00:20:15,484 --> 00:20:19,096
Quanto mais a Wikidata estiver integrada
nos projetos Wikimedia,
310
00:20:19,096 --> 00:20:22,472
mais as pessoas terão
necessidade de falar umas com as outras
311
00:20:22,472 --> 00:20:25,705
acerca dos dados sem que a língua
seja a mesma.
312
00:20:25,705 --> 00:20:31,680
Temos de arranjar forma
de lidar com isso.
313
00:20:33,276 --> 00:20:36,634
Se alguém tem alguma boa ideia,
adoraria falar convosco.
314
00:20:38,790 --> 00:20:41,365
E, com isso,
encerro a minha apresentação.
315
00:20:41,618 --> 00:20:44,248
Obrigada a todos, por darem a mais pessoas
316
00:20:44,248 --> 00:20:46,305
acesso a mais conhecimento,
todos os dias.
317
00:20:46,305 --> 00:20:53,418
(aplausos)
318
00:20:58,015 --> 00:20:59,902
Temos algum tempo para questões.
319
00:20:59,902 --> 00:21:01,774
Portanto, se alguém na plateia
tiver alguma
320
00:21:01,774 --> 00:21:04,975
ou mesmo os que estiverem remotamente
a ver a transmissão: Olá mãe.
321
00:21:04,992 --> 00:21:08,072
Podem perguntar no EtherPad
322
00:21:08,072 --> 00:21:11,387
ou no canal do Telegram
e faremos o nosso melhor.
323
00:21:11,387 --> 00:21:13,233
Alguma coisa?
324
00:21:15,516 --> 00:21:16,655
Ah.
325
00:21:21,133 --> 00:21:25,208
(plateia 1) Olá a todos. Isto é mais
um meme que uma questão.
326
00:21:25,243 --> 00:21:32,341
Então, quando é que a extensão de tempo
poderá ter também
327
00:21:32,341 --> 00:21:35,509
horas e minutos e segundos?
328
00:21:35,509 --> 00:21:38,376
Porque, até agora,
a posição é apenas de data.
329
00:21:38,376 --> 00:21:41,610
- Eu sei... não é uma pergunta minha.
- (risos)
330
00:21:41,610 --> 00:21:44,230
Por isso disse que era um meme.
331
00:21:44,230 --> 00:21:46,093
É assim sempre,
332
00:21:46,093 --> 00:21:48,738
mas vem sempre do remoto, por isso...
333
00:21:50,001 --> 00:21:53,188
Eu não tenho uma boa resposta para isso.
334
00:21:53,188 --> 00:21:54,443
Desculpa.
335
00:21:55,678 --> 00:22:01,636
Mas talvez, no fundo,
as pessoas precisem ainda mais disso
336
00:22:01,636 --> 00:22:07,531
para descrever imagens no Commons.
Portanto, até pode subir na longa lista
337
00:22:07,531 --> 00:22:11,071
de coisas que precisam de ser feitas
com mais rapidez.
338
00:22:14,713 --> 00:22:16,236
Mais alguma questão?
339
00:22:24,686 --> 00:22:27,655
(plateia 2) Linda, da equipa de pesquisa
da Fundação Wikimedia.
340
00:22:27,655 --> 00:22:31,080
Tenho uma pergunta acerca do que pensa
341
00:22:31,080 --> 00:22:37,763
sobre patrulhamento e que poderá estar
relacionado com a qualidade do conteúdo,
342
00:22:37,803 --> 00:22:39,756
mas pode falar sobre isso.
343
00:22:39,756 --> 00:22:43,542
Como vê, a médio prazo,
os esforços de patrulhamento a mudar,
344
00:22:43,542 --> 00:22:45,557
especialmente com o projeto Bridge,
345
00:22:45,559 --> 00:22:48,147
o qual estou muito ansiosa
por ir testar.
346
00:22:48,147 --> 00:22:49,903
- Sim, obrigada.
- Sim.
347
00:22:52,298 --> 00:22:56,812
Portanto, como diz, com coisas
como as que fizemos no Bridge,
348
00:22:58,812 --> 00:23:03,287
muito mais esforço terá que ser dispensado
em patrulhamento, penso.
349
00:23:04,362 --> 00:23:08,554
Mas estamos agora com uma dimensão
em que, provavelmente, não é exequível
350
00:23:08,554 --> 00:23:10,922
fazê-lo à mão, por humanos.
351
00:23:10,922 --> 00:23:15,090
Portanto, precisamos de um maior
esforço em melhorias, por exemplo.
352
00:23:15,090 --> 00:23:18,387
do ORES, o sistema de aprendizagem
máquina, para que nos ajude com isso.
353
00:23:18,407 --> 00:23:24,588
Para ajudar-nos a perceber que edições
precisam de ser vistas por um humano
354
00:23:24,588 --> 00:23:26,493
e quais são, provavelmente: "Certo,
355
00:23:26,493 --> 00:23:29,792
são coisas normais,
não preciso olhar para isto."
356
00:23:33,777 --> 00:23:38,878
Atualmente, o ORES não é muito bom
a avaliar o que...
357
00:23:38,878 --> 00:23:41,459
se uma edição na Wikidata é boa ou não.
358
00:23:41,459 --> 00:23:44,549
Existe, atualmente,
uma campanha a decorrer
359
00:23:44,549 --> 00:23:50,280
para treinar o sistema de aprendizagem
máquina,
360
00:23:51,062 --> 00:23:52,474
com a vossa ajuda.
361
00:23:53,141 --> 00:23:55,550
Para lhe ensinar, basicamente,
o que uma boa edição é
362
00:23:55,550 --> 00:23:57,078
e o que uma má edição é.
363
00:23:57,109 --> 00:24:02,774
Ainda não chegámos ao patamar
de suficientes humanos o terem ensinado
364
00:24:02,774 --> 00:24:08,025
para realmente o melhorarmos,
mas, se tiverem uns minutinhos,
365
00:24:08,025 --> 00:24:11,098
seria bestial que ajudassem
a ensinar o ORES
366
00:24:11,098 --> 00:24:13,586
a fazer melhores julgamentos
acerca de edições na Wikidata.
367
00:24:13,586 --> 00:24:15,837
E é relativamente simples:
ele mostra uma edição
368
00:24:15,842 --> 00:24:17,584
e vocês dizem: "É uma boa edição",
369
00:24:17,584 --> 00:24:19,658
"É uma má edição" e mais nada.
370
00:24:20,041 --> 00:24:23,193
Podem fazer isso sentados no sofá,
à noite, em frente da TV.
371
00:24:25,588 --> 00:24:27,021
(plateia 3) Partilhe uma ligação.
372
00:24:28,000 --> 00:24:31,059
Iremos partilhar uma ligação
no grupo do Telegram sim.
373
00:24:32,239 --> 00:24:36,239
E, assim que tivermos chegado
ao patamar de que precisamos--
374
00:24:36,239 --> 00:24:39,269
penso que é à volta de 7 000,
mas posso estar enganada--
375
00:24:40,223 --> 00:24:44,359
então, podemos correr o programa de treino
novamente e nessa altura será,
376
00:24:44,374 --> 00:24:48,484
esperemos, consideravelmente melhor
a julgar as edições na Wikidata.
377
00:24:49,909 --> 00:24:52,063
E, depois, espero que mais de vocês
possam usar isso
378
00:24:52,063 --> 00:24:56,029
para filtrar as alterações recentes,
por exemplo, na vossa lista
379
00:24:56,029 --> 00:24:58,333
para edições que realmente
precisam da vossa atenção.
380
00:24:59,093 --> 00:25:00,227
Sim.
381
00:25:02,639 --> 00:25:04,124
Olá.
382
00:25:04,124 --> 00:25:06,120
[inaudível]
383
00:25:07,116 --> 00:25:09,964
(plateia 4) Estou um pouco curiosa
e esta é um pergunta que não é minha,
384
00:25:09,964 --> 00:25:12,729
mas de colegas
com quem tenho trabalhado.
385
00:25:12,729 --> 00:25:16,190
Quantos mais parceiros
se juntam à Wikidata
386
00:25:16,190 --> 00:25:19,916
e começam a experimentar com consultas,
387
00:25:19,916 --> 00:25:23,079
mais problemas temos
com tempos esgotados nas consultas.
388
00:25:23,079 --> 00:25:25,698
Portanto, o que
se está a fazer sobre isso?
389
00:25:27,732 --> 00:25:30,170
Então, algumas pessoas
na Fundação Wikimedia
390
00:25:30,170 --> 00:25:34,355
estão a analisar isso
e-- pequena indiscrição--
391
00:25:34,355 --> 00:25:36,988
estejam na sessão do presente
de aniversário.
392
00:25:36,988 --> 00:25:39,221
(risos)
393
00:25:43,384 --> 00:25:46,201
(Bart) Olá, sou Bart Magnus
do PACKED Bélgica.
394
00:25:46,201 --> 00:25:48,620
Gostaria de saber se sabe
em que estado estão
395
00:25:48,620 --> 00:25:52,115
as federações, ou seja, reutilizar
as tuas propriedades
396
00:25:52,115 --> 00:25:53,752
na tua própria instância da Wikibase.
397
00:25:53,752 --> 00:25:56,887
Há algo que queria mencionar
em relação a isso?
398
00:25:56,898 --> 00:26:01,425
Então, ao longo do último ano,
muitas pessoas nos têm dito
399
00:26:01,425 --> 00:26:03,996
que querem a federação, certo?
400
00:26:03,996 --> 00:26:06,746
Mas o problema era que
muitas pessoas tinham
401
00:26:06,746 --> 00:26:09,318
várias ideias diferentes
do que significava federação.
402
00:26:10,566 --> 00:26:13,533
Algumas dessas coisas
eram facilmente executáveis.
403
00:26:13,533 --> 00:26:15,664
Outras eram realmente
muito difíceis.
404
00:26:16,934 --> 00:26:22,148
E a minha equipa e eu temos falado
com muitas pessoas, por exemplo,
405
00:26:22,148 --> 00:26:27,193
os parceiros com quem trabalhamos
nas bibliotecas, para ver se concluíamos
406
00:26:27,193 --> 00:26:28,836
precisamente o que precisavam.
407
00:26:30,111 --> 00:26:33,893
E terminámos isso agora.
Embora, claro, esteja disponível
408
00:26:33,893 --> 00:26:37,850
para receber mais comentários
se quiserem falar comigo sobre isso.
409
00:26:37,850 --> 00:26:41,397
Estou agora numa fase
onde confortavelmente digo:
410
00:26:41,397 --> 00:26:43,480
"Certo, vamos começar com isto."
411
00:26:44,606 --> 00:26:48,197
E diria que nos próximos
dois ou três meses
412
00:26:48,197 --> 00:26:51,243
vamos escrever
as primeiras linhas de código.
413
00:26:51,243 --> 00:26:53,793
Depois, se tudo correr bem,
tê-lo-emos pronto para as pessoas
414
00:26:53,793 --> 00:26:56,533
o testarem, diria que
no início do próximo ano.
415
00:26:59,661 --> 00:27:01,023
(moderador) Últimas questões.
416
00:27:02,147 --> 00:27:05,603
(Finn) Finn Årup Nielsen de Copenhaga,
Dinamarca.
417
00:27:05,973 --> 00:27:09,833
Em relação à outra linguagem,
tem havido muita discussão, digamos,
418
00:27:09,833 --> 00:27:13,617
na comunidade WikiCite
acerca de se devemos continuar
419
00:27:13,617 --> 00:27:15,745
a colocar mais trabalhos científicos ali.
420
00:27:15,745 --> 00:27:19,913
Isto está relacionado com quandos dados
podemos nós colocar na Wikidata.
421
00:27:19,913 --> 00:27:23,032
Tempos esgotados no Wikidata
Query Service é uma das questões,
422
00:27:23,032 --> 00:27:24,468
mas também a manutenção.
423
00:27:24,468 --> 00:27:30,300
Portanto, o que pensa acerca...
424
00:27:31,060 --> 00:27:35,173
O tamanho da Wikidata
está a começar a ser um problema,
425
00:27:35,173 --> 00:27:36,237
no geral?
426
00:27:36,237 --> 00:27:38,666
Devemos parar de colocar
dados nos lexemas?
427
00:27:38,666 --> 00:27:41,222
Devemos parar de colocar
dados científicos
428
00:27:41,222 --> 00:27:45,717
na Wikidata ou temos alguma
pesquisa sobre isto
429
00:27:45,717 --> 00:27:50,053
ou estão a inflacionar
os problemas técnicos?
430
00:27:50,292 --> 00:27:51,445
Sim...
431
00:27:53,266 --> 00:27:57,419
A Wikidata está definitivamente
a chegar a algumas...
432
00:27:58,906 --> 00:28:02,732
fronteiras de escalabilidade, digamos,
433
00:28:03,740 --> 00:28:05,975
tanto técnica como socialmente.
434
00:28:05,975 --> 00:28:09,197
E, para ambas,
precisamos de soluções, certo?
435
00:28:09,197 --> 00:28:12,518
Socialmente, temos por exemplo
mais editores
436
00:28:12,518 --> 00:28:15,689
e mudanças recentes, até ao ponto
em que é completamente inviável
437
00:28:15,689 --> 00:28:19,623
a um humano patrulhar isso
porque é pura e simplesmente demais.
438
00:28:21,246 --> 00:28:26,205
Mas também tecnicamente
e temos tentado resolver isso também.
439
00:28:26,205 --> 00:28:29,958
Por exemplo, re-arquiteturando
a base de dados
440
00:28:29,958 --> 00:28:32,278
à volta de tabelas de BD
viradas para a visualização,
441
00:28:32,278 --> 00:28:35,309
se é que isto vos diz algo.
442
00:28:35,900 --> 00:28:38,366
Mas isso só nos leva até determinado ponto
443
00:28:38,516 --> 00:28:41,343
e uma das coisas que queremos
ver no próximo ano
444
00:28:41,343 --> 00:28:45,968
é onde estão os outros
pontos difíceis e o que fazer com eles
445
00:28:45,968 --> 00:28:47,585
no aspeto técnico.
446
00:28:49,085 --> 00:28:50,728
Portanto, esse é o quadro geral.
447
00:28:50,728 --> 00:28:54,455
Ao mesmo tempo, fico muito hesitante
448
00:28:54,455 --> 00:28:58,387
em dizer a alguém, "Não, não,
não. Para de inserir dados na Wikidata."
449
00:28:58,738 --> 00:29:00,090
(risos)
450
00:29:00,090 --> 00:29:02,408
Isso vai um pouco contra
o propósito da coisa.
451
00:29:04,311 --> 00:29:07,061
Mas, por exemplo, o ecosistema Wikibase
452
00:29:07,061 --> 00:29:09,220
é uma forma de tentar resolver
isso
453
00:29:09,220 --> 00:29:13,952
sem requerer nada da Wikidata.
454
00:29:13,952 --> 00:29:16,267
Essa é a beleza de um sistema
aberto de dados ligados.
455
00:29:16,267 --> 00:29:18,298
Não temos de ter tudo
no mesmo sítio.
456
00:29:18,298 --> 00:29:20,582
Podemos ligar-nos a vários sítios.
É espantoso.
457
00:29:21,957 --> 00:29:28,309
Portanto, de volta à WikiCites
em específico, sim...
458
00:29:29,294 --> 00:29:34,358
Certo, a WikiCites em específico.
Eu penso que precisamos
459
00:29:34,358 --> 00:29:36,196
de olhar para isso proporcionalmente.
460
00:29:36,196 --> 00:29:40,548
Não tenho uma percentagem exata
de qual a quantidade
461
00:29:40,548 --> 00:29:44,381
de items da Wikidata
que estão à volta de tópicos da WikiCites,
462
00:29:44,381 --> 00:29:46,606
mas é uma grande percentagem.
463
00:29:46,606 --> 00:29:49,869
E talvez seja isso que
precisamos de discutir...
464
00:29:50,356 --> 00:29:52,442
Durante a pausa.
465
00:29:53,191 --> 00:29:54,616
Muito obrigado!
466
00:29:54,616 --> 00:30:01,689
(aplausos)