1
00:00:06,254 --> 00:00:08,249
Boa tarde a todos.
2
00:00:08,929 --> 00:00:12,068
Bem vindos ao nosso painel GLAM.
3
00:00:13,124 --> 00:00:17,009
Antes de começarmos,
tenho dois anúncios a fazer.
4
00:00:17,329 --> 00:00:23,049
Em primeiro lugar, usem exaustivamente
o Etherpad para tirar notas, por favor.
5
00:00:23,781 --> 00:00:27,998
O segundo é direcionado
para a nossa audiência em casa,
6
00:00:27,998 --> 00:00:29,819
ou onde quer que estejam.
7
00:00:29,819 --> 00:00:30,958
Se tiverem alguma questão,
8
00:00:30,958 --> 00:00:34,028
podem sempre escrever no Etherpad,
9
00:00:34,028 --> 00:00:37,828
e os nossos anjos na sala
darão seguimento.
10
00:00:39,328 --> 00:00:44,348
Decidimos que, para o painel deste ano,
11
00:00:45,388 --> 00:00:48,868
depois de ver
todas as contribuições que foram fazendo,
12
00:00:49,128 --> 00:00:52,118
que deveríamos focar-nos
no papel de Wikidata
13
00:00:52,129 --> 00:00:54,297
dentro dos ecossistemas de dados
14
00:00:54,297 --> 00:00:57,199
para ir além
dos projetos de Wikimedia atuais.
15
00:00:57,199 --> 00:00:59,987
O que está perfeitamente alinhado
16
00:00:59,987 --> 00:01:03,732
com a estratégia
da nova Fundação Wikimedia.
17
00:01:04,652 --> 00:01:07,947
E, hoje, temos quatro oradores.
18
00:01:08,387 --> 00:01:09,876
Três mais um.
19
00:01:09,876 --> 00:01:13,636
Por isso, quero pedir-lhes
para subirem ao palco,
20
00:01:13,636 --> 00:01:15,165
para que vos possa apresentar.
21
00:01:22,394 --> 00:01:24,895
Temos a Susanna Ånäs.
22
00:01:25,385 --> 00:01:29,296
Ela é activista
pelo conhecimento livre há muito tempo
23
00:01:29,296 --> 00:01:31,601
e está envolvida em vários WikiProjects.
24
00:01:31,916 --> 00:01:35,526
E vai fazer hoje o relatório
do projeto em cooperação
25
00:01:35,526 --> 00:01:38,396
com a Biblioteca Nacional da Finlândia.
26
00:01:38,856 --> 00:01:43,435
Depois temos, ao meu lado, Mike Dickison,
27
00:01:43,435 --> 00:01:46,325
que vai ser o segundo orador.
28
00:01:46,995 --> 00:01:50,283
Ele é curador num museu na Nova Zelândia.
29
00:01:50,283 --> 00:01:53,815
É zoólogo e editor da Wikipedia.
30
00:01:53,815 --> 00:01:58,788
E foi o primeiro Wikipedian
da Nova Zelândia em residência
31
00:01:58,788 --> 00:02:02,565
em 2018 e 2019.
32
00:02:02,565 --> 00:02:06,634
Vai contar-nos
sobre a sua experiência neste papel
33
00:02:06,634 --> 00:02:13,105
e o que está a ser feito
no contexto de trabalho para a Wikidata.
34
00:02:15,784 --> 00:02:20,480
Depois vamos ter Joachim Neubert
vindo do Centro de Informação
35
00:02:20,480 --> 00:02:23,461
para a Economia de Leibniz
em Kiel e Hamburgo.
36
00:02:24,011 --> 00:02:29,131
Esteve a trabalhar para fazer o maior
arquivo público mundial de imprensa
37
00:02:29,131 --> 00:02:34,655
mais acessível ao público,
e está a utilizar a Wikidata para isso.
38
00:02:35,890 --> 00:02:38,091
Eu serei o último a falar.
39
00:02:38,091 --> 00:02:39,468
O meu nome é Beat Estermann.
40
00:02:39,468 --> 00:02:43,080
Trabalho para a Universidade de Berna
de Ciências Aplicadas, na Suiça.
41
00:02:43,640 --> 00:02:49,950
Tenho sido um promotor, há muito tempo, da
OpenGLAM na Suiça e Áustria.
42
00:02:50,975 --> 00:02:55,610
Hoje, falo-vos sobre as minhas atividades
em ligação com o mandato
43
00:02:55,610 --> 00:02:59,460
da Associação
de Representação de Artes Canadiana,
44
00:02:59,460 --> 00:03:01,270
focadas nas artes performativas.
45
00:03:02,121 --> 00:03:04,440
Não principalmente na Wikidata,
46
00:03:04,510 --> 00:03:08,491
mas verão que a Wikidata está a começar
a ter um papel ativo, também ali.
47
00:03:08,970 --> 00:03:13,250
Agora, a maior parte de nós
vai sentar-se por aqui,
48
00:03:13,250 --> 00:03:16,980
e vou dar o palco à Susanna.
49
00:03:20,680 --> 00:03:23,690
Olá, o meu nome é Susanna Ånäs.
50
00:03:23,690 --> 00:03:25,769
Trabalho em part-time
para a Wikimedia Finlândia
51
00:03:25,769 --> 00:03:27,079
como coordenadora para a GLAM
52
00:03:27,079 --> 00:03:32,655
e faço também consultoria
na esfera do conhecimento livre.
53
00:03:32,655 --> 00:03:36,049
Este é um discurso, talvez de,
falar da consultoria e não do part-time.
54
00:03:36,549 --> 00:03:39,219
Tenho estado envolvida em temas
55
00:03:40,089 --> 00:03:45,539
de grupos de dados geográficos,
56
00:03:45,539 --> 00:03:48,299
de...
57
00:03:48,299 --> 00:03:51,147
Bem, fui verificar os termos em Inglês,
58
00:03:51,147 --> 00:03:54,497
tem a ver com uma iniciativa cultural
hereditária do Governo da Finlândia.
59
00:03:56,077 --> 00:03:59,752
Isto tem a ver com nomes de locais
60
00:03:59,752 --> 00:04:03,300
e como são representados
61
00:04:03,300 --> 00:04:07,466
nos diferentes repositórios
no setor da GLAM na Finlândia
62
00:04:07,466 --> 00:04:11,755
e como estão a tentar conciliar
as diferentes fontes de informação
63
00:04:11,755 --> 00:04:17,906
e como estão a informar-se
modelando na Wikidata e outros locais.
64
00:04:17,906 --> 00:04:23,315
Aqui podemos ver as três grandes fontes
de informação para estes locais YSO,
65
00:04:23,315 --> 00:04:27,944
que fazem parte
da ontologia nacional, ontologia geral.
66
00:04:27,944 --> 00:04:29,665
AHAA são os arquivos finlandeses,
67
00:04:29,665 --> 00:04:31,645
Melinda são as bibliotecas finlandesas,
68
00:04:31,645 --> 00:04:33,750
e KOOKOS são os museus finlandeses.
69
00:04:33,750 --> 00:04:37,585
Existem também,
três sistemas de gestão de conteúdo
70
00:04:37,585 --> 00:04:40,290
que são conciliados nesses locais YSO.
71
00:04:40,745 --> 00:04:47,365
Existem, também, intercâmbios
entre a Wikidata a funcionar,
72
00:04:47,965 --> 00:04:53,065
assim como o projeto de nomes
para o Cadastro Nacional de Terrenos.
73
00:04:53,065 --> 00:04:56,285
E existe um terceiro projeto,
o Arquivo de Nomes Finlandês,
74
00:04:56,285 --> 00:05:00,391
que ainda não contribui para isto,
75
00:05:00,391 --> 00:05:02,715
mas existem planos para que o faça.
76
00:05:02,715 --> 00:05:09,175
Um dos assuntos de modelação
principais nesta área problemática
77
00:05:09,175 --> 00:05:15,226
é que existem três tipos
de elementos de nomenclatura
78
00:05:16,116 --> 00:05:18,195
representados neste projeto.
79
00:05:18,195 --> 00:05:21,236
Um deles é o local,
o que tem a localização.
80
00:05:21,236 --> 00:05:24,766
E outro é a nomenclatura,
a toponímia, por exemplo.
81
00:05:25,006 --> 00:05:27,696
Depois, existem as fontes,
que são documentos
82
00:05:27,696 --> 00:05:30,756
dos quais
os dois anteriores podem derivar,
83
00:05:30,756 --> 00:05:32,565
ou, serem suportados.
84
00:05:32,565 --> 00:05:35,845
Os locais YSO,
aqui, no canto superior direito,
85
00:05:35,845 --> 00:05:38,799
verão o mesmo diagrama de novo.
86
00:05:38,799 --> 00:05:41,189
Foca-se maioritariamente nos locais.
87
00:05:42,619 --> 00:05:46,279
O aspecto principal disto
é a Biblioteca Nacional Finlandesa,
88
00:05:46,279 --> 00:05:49,159
e o Projeto Finto.
89
00:05:50,199 --> 00:05:55,608
Existem agora mais de 7,000 locais
em finlandês e sueco
90
00:05:55,608 --> 00:05:59,438
e mais de 3,000 em inglês,
91
00:05:59,438 --> 00:06:03,042
e são CC0 com quem nós licenciámos.
92
00:06:03,042 --> 00:06:06,008
Aqui podem ver o serviço do Finto.
93
00:06:06,008 --> 00:06:09,883
e um local, escolhi Sevettijärvi.
94
00:06:09,883 --> 00:06:13,908
Está agora também relacionado
com o nosso projeto linguístico
95
00:06:13,908 --> 00:06:15,268
com o Skolt Sámi...
96
00:06:15,268 --> 00:06:18,877
É um local no norte longínquo da Finlândia
97
00:06:18,877 --> 00:06:21,651
habitado por Skolt Sámi.
98
00:06:22,798 --> 00:06:27,239
Aqui podem ver o local que pertence a...
99
00:06:28,405 --> 00:06:33,057
Aqui podem ver dados sobre este local.
100
00:06:33,057 --> 00:06:37,624
Podem ver que está ligado à Wikidata,
101
00:06:37,624 --> 00:06:42,189
e também a estes dados cartográficos
nacionais.
102
00:06:43,366 --> 00:06:47,044
Aqui vamos.
E podem ver com mais detalhes, aqui.
103
00:06:48,996 --> 00:06:52,696
Está também hierarquicamente arranjado
104
00:06:52,696 --> 00:06:57,405
dentro deste repositório, para que...
105
00:06:57,580 --> 00:07:00,460
Bem, na realidade,
o local em si não é visto,
106
00:07:00,460 --> 00:07:05,880
mas está por baixo desta municipalidade,
107
00:07:05,880 --> 00:07:08,010
como também da região
108
00:07:08,010 --> 00:07:10,154
e da Finlândia como país
e países nórdicos,
109
00:07:10,154 --> 00:07:12,650
como região fronteiriça.
110
00:07:12,650 --> 00:07:14,400
Aqui podem ver que muitos destes
111
00:07:14,400 --> 00:07:17,891
foram conciliados
com a Wikidata anteriormente
112
00:07:18,730 --> 00:07:22,230
através de Mix'n'Match,
e que existem ainda alguns remanescentes.
113
00:07:22,230 --> 00:07:27,900
Mas mesmo assim o número de nomes
não é assim tão alto.
114
00:07:28,411 --> 00:07:30,844
São menos de 5,000.
115
00:07:31,570 --> 00:07:33,860
E existe este outro repositório
116
00:07:33,860 --> 00:07:38,040
propriedade do Projeto
de Plataforma Geoespacial Finlandês...
117
00:07:38,040 --> 00:07:39,199
Quadros de Nomes de Locais.
118
00:07:39,199 --> 00:07:41,729
Estes são nomes de locais
que estão no mapa Finlandês.
119
00:07:42,130 --> 00:07:48,308
E têm os dados ligados,
licenciados como CC BY 4.0.
120
00:07:48,518 --> 00:07:54,478
800,000 nomes em Finlandês, Sueco
e nas outras três línguas Saami
121
00:07:54,478 --> 00:07:55,778
que existem na Finlândia.
122
00:07:55,997 --> 00:07:58,877
Depois têm dois tipos de entidades.
123
00:07:58,877 --> 00:08:00,680
Outros são locais, e os outros
124
00:08:00,680 --> 00:08:02,651
são nomes de locais, topónimos.
125
00:08:02,651 --> 00:08:05,271
Ambos têm URIs
(identificador uniforme de recurso).
126
00:08:06,001 --> 00:08:09,721
Aqui, por exemplo, o mesmo Sevettijärvi,
primeiro em finlandês,
127
00:08:09,721 --> 00:08:14,001
e depois nas outras três línguas Saami,
bem como os dados geográficos.
128
00:08:14,001 --> 00:08:20,526
Por último, temos mais informação
sobre isso, como o tipo de local, etc.
129
00:08:21,640 --> 00:08:28,641
Aqui, vemos o quadro para o nome do local,
o topónimo, a ter o seu próprio URI.
130
00:08:29,943 --> 00:08:33,738
Desculpem, parece
que não está traduzido para inglês.
131
00:08:34,432 --> 00:08:39,151
Então, as multilínguas
não abrangem o projeto inteiro.
132
00:08:39,847 --> 00:08:42,523
Chegámos ao Arquivo de Nomes Finlandeses.
133
00:08:42,523 --> 00:08:46,234
Este projeto é
do Instituto de Línguas da Finlândia,
134
00:08:46,234 --> 00:08:50,456
que não representa locais,
nem os nomes dos locais,
135
00:08:50,456 --> 00:08:52,603
mas sim a origem disso tudo.
136
00:08:52,603 --> 00:08:57,123
São três milhões de campos
de notas de nomes de locais,
137
00:08:57,723 --> 00:08:59,529
e é um projeto Wikibase.
138
00:08:59,529 --> 00:09:03,325
Estão numa Wikibase, principalmente
em finlandês, mas alguns também em sueco.
139
00:09:03,325 --> 00:09:08,111
Uma espantosa coleção de nomes em Saami,
nos quais estamos bastante interessados.
140
00:09:08,111 --> 00:09:10,141
E estão licenciados em CC BY.
141
00:09:11,540 --> 00:09:14,850
Isto também é um desafio
do ponto de vista da Wikidata.
142
00:09:14,850 --> 00:09:17,640
Mas se houvesse
uma Wikibase local finlandesa,
143
00:09:17,640 --> 00:09:22,632
éramos capazes de trabalhar primeiro neles
dentro desse projeto.
144
00:09:23,034 --> 00:09:25,343
Então, aqui temos uma imagem disso,
145
00:09:26,443 --> 00:09:31,323
que mostra que existe
informação sobre o local, os mapas...
146
00:09:31,323 --> 00:09:35,227
dos mapas
que os colectores usaram inicialmente.
147
00:09:35,227 --> 00:09:40,713
e um quadro que produziram
a partir da informação recolhida.
148
00:09:41,245 --> 00:09:46,416
Aqui está um desses quadros
149
00:09:46,416 --> 00:09:48,736
decomposto nos dados
150
00:09:48,736 --> 00:09:50,676
que está incluído nele.
151
00:09:51,156 --> 00:09:53,751
Eles enviaram
este projeto de dados sincronizados
152
00:09:53,751 --> 00:09:58,256
pelo Helsinki Digital Humanities Lab
and Semantic Computers,
153
00:09:58,256 --> 00:10:01,446
o grupo de computação
da Universidade de Aalto
154
00:10:01,446 --> 00:10:06,525
em conjunto com o Instituto
para as Línguas da Finlândia...
155
00:10:06,525 --> 00:10:07,994
o Names Sampo.
156
00:10:07,994 --> 00:10:11,024
Este é um interface agregado de pesquisa
157
00:10:11,024 --> 00:10:13,503
para várias fontes de nomes.
158
00:10:13,503 --> 00:10:17,704
Aqui conseguem ver que
várias das fontes estão aqui à esquerda
159
00:10:17,704 --> 00:10:20,763
e que podem fazer
vários tipos de visualização
160
00:10:20,763 --> 00:10:22,653
baseados nestes dados.
161
00:10:27,259 --> 00:10:30,603
Tenho trazido esta ideia
de modelação para uma Wikibase local
162
00:10:30,603 --> 00:10:32,683
que poderiamos fazer com estes dados.
163
00:10:33,133 --> 00:10:36,580
Mas, quando entramos
nestas questões de modelação,
164
00:10:36,580 --> 00:10:37,770
como o faremos?
165
00:10:37,770 --> 00:10:41,589
Existem várias formas,
diferentes tradições em cada um deles.
166
00:10:46,782 --> 00:10:50,360
A boa noticia é que podemos
servir línguas minoritárias
167
00:10:50,360 --> 00:10:52,475
com muito pouco esforço.
168
00:10:53,243 --> 00:10:57,179
Então, aqui temos as duas opões básicas:
169
00:10:57,179 --> 00:11:01,660
o modelo SAPO, que é
a Ontologia Finlandesa Espaço-Tempo,
170
00:11:02,841 --> 00:11:04,421
e o modelo Wikidata.
171
00:11:04,421 --> 00:11:07,909
Aqui podem ver que
os itens Wikidata tendem para ser zero.
172
00:11:07,909 --> 00:11:12,871
Idealmente, permanecem sem alteração
com as propriedades modificadas.
173
00:11:12,871 --> 00:11:16,909
Enquanto no modelo SAPO,
estes itens tornam-se novos
174
00:11:16,909 --> 00:11:20,399
quando existe uma modificação,
tal como mudança de área e nome.
175
00:11:21,179 --> 00:11:26,219
Então, aqui,
voltando atrás para esta divisão
176
00:11:26,219 --> 00:11:31,719
entre estas três dimensões diferentes
de locais, nomes de locais.
177
00:11:32,099 --> 00:11:37,659
Devemos colocar estes nomes de locais
em entidades ou propriedades?
178
00:11:37,659 --> 00:11:39,248
A Wikidata usa propriedades,
179
00:11:39,248 --> 00:11:43,098
enquanto este projeto
de cartografia utiliza entidades.
180
00:11:43,838 --> 00:11:46,177
Ou devemos torná-la um lexema?
181
00:11:46,177 --> 00:11:51,426
A Wikidata escolheu
trabalhar com propriedades,
182
00:11:51,426 --> 00:11:54,956
propriedades textuais
para nomes de locais ao invés de lexemas.
183
00:11:55,567 --> 00:11:57,818
Lamento, é o contrário.
184
00:11:57,818 --> 00:11:59,631
Então, os nomes são...
185
00:12:03,056 --> 00:12:04,941
propriedades, não lexemas.
186
00:12:05,874 --> 00:12:06,877
Certo.
187
00:12:07,425 --> 00:12:11,472
E talvez a falha da Wikibase
188
00:12:11,472 --> 00:12:16,340
seja a falta
de formas geográficas dentro disso...
189
00:12:16,340 --> 00:12:20,958
Como a configuração base disso,
190
00:12:20,958 --> 00:12:24,748
para que cada um possa adicionar
mais tecnologia à pilha
191
00:12:24,748 --> 00:12:29,865
de forma a poder utilizar
formas geográficas locais.
192
00:12:29,865 --> 00:12:31,823
O que é realmente preciso
é uma federação
193
00:12:31,823 --> 00:12:38,328
para se conseguir tirar partido
do colectivo da Wikidata.
194
00:12:38,758 --> 00:12:43,052
E penso que terminei. Obrigada.
195
00:12:43,616 --> 00:12:45,530
(orador a rir)
196
00:12:45,530 --> 00:12:49,057
(aplausos)
197
00:13:01,115 --> 00:13:02,514
Está bem.
198
00:13:03,134 --> 00:13:05,011
(orador a falar em maori)
199
00:13:05,011 --> 00:13:07,655
Bem vindos a todos.
O meu nome é Mike Dickison.
200
00:13:08,375 --> 00:13:10,149
Por um ano,
201
00:13:10,149 --> 00:13:13,075
fui o Wikipedista
da Nova Zelândia em residência.
202
00:13:13,935 --> 00:13:16,935
Devem estar a perguntar-se
o que é um Wikipedista em residência.
203
00:13:17,856 --> 00:13:21,875
Porque se forem mesmo procurar o que é,
não existe tal termo, como podemos ver.
204
00:13:22,735 --> 00:13:25,855
É um termo que eu inventei
na proposta de bolsa,
205
00:13:26,153 --> 00:13:29,003
e do qual a fundação
pareceu gostar imenso.
206
00:13:29,983 --> 00:13:31,533
E como tal, avançámos com ele.
207
00:13:32,303 --> 00:13:36,510
Por isso, por um ano,
passei por 35 instituições diferentes,
208
00:13:37,473 --> 00:13:41,473
tive estagiários, e muitas vezes,
dei sessões de treino.
209
00:13:41,493 --> 00:13:44,363
Organizei eventos públicos,
e tentei desenvolver
210
00:13:44,363 --> 00:13:47,230
uma estratégia Wikimedia
para cada um deles.
211
00:13:47,808 --> 00:13:49,498
Foi uma experiência bastante interessante,
212
00:13:49,498 --> 00:13:52,997
e encontra-se uma variedade ampla
de diferentes projetos e pessoas.
213
00:13:53,297 --> 00:13:58,211
Queria tentar falar de alguns
dos diferentes projetos
214
00:13:58,211 --> 00:14:00,345
que lidaram com a Wikidata
215
00:14:00,872 --> 00:14:05,171
de formas interessantes ou talvez,
de formas iluminadas,
216
00:14:05,171 --> 00:14:07,591
que talvez sejam úteis
para as pessoas discutirem.
217
00:14:08,561 --> 00:14:11,961
O projeto foi inicialmente
um projeto Wikipédia, pelo nome,
218
00:14:11,961 --> 00:14:14,811
simplesmente porque era com isso
que as pessoas estavam familiarizadas.
219
00:14:15,281 --> 00:14:18,360
Como tal, organizámos
vários eventos diferentes
220
00:14:18,360 --> 00:14:23,135
em editatonas bem tradicionais,
trabalho para a igualdade de género, etc.
221
00:14:24,607 --> 00:14:26,752
E uma quantidade grande de...[inaudível]
222
00:14:27,410 --> 00:14:30,812
E uma quantidade grande de novos
editores recrutados, bem sucedidos, etc.
223
00:14:31,754 --> 00:14:34,454
Fizemos carregamentos de volume
para o Commons.
224
00:14:35,454 --> 00:14:41,246
Neste caso, existia uma coleção
de mais de 1,000 desenhos originais
225
00:14:41,246 --> 00:14:46,047
feitos por
um ilustrador entomólogo, Des Helmore,
226
00:14:46,047 --> 00:14:47,927
que estiveram parados
dentro de um disco rígido,
227
00:14:47,927 --> 00:14:50,357
à espera de pesquisa durante uns 10 anos.
228
00:14:50,357 --> 00:14:54,182
Conseguimos autorização para os libertar
dentro de uma licença CC BY.
229
00:14:54,182 --> 00:14:57,963
Sabem como é. Vitórias fáceis
para mostrar às pessoas por lá.
230
00:14:57,963 --> 00:15:01,095
Qualquer um pode perceber
várias fotografias dos escaravelhos.
231
00:15:01,095 --> 00:15:06,903
Qualquer um entende workshops dedicadas
a tentar colmatar a igualdade de género.
232
00:15:07,250 --> 00:15:10,061
Mas a Wikidata
é muito mais difícil de vender
233
00:15:10,061 --> 00:15:12,696
a pessoas no setor GLAM,
(galerias, bibliotecas, arquivos e museus)
234
00:15:12,696 --> 00:15:15,095
ou a alguém fora
do nosso movimento tão particular.
235
00:15:16,107 --> 00:15:19,717
Então, comecei
a aperceber-me que a Wikidata
236
00:15:19,717 --> 00:15:22,634
ia ser uma parte cada vez mais importante
237
00:15:22,634 --> 00:15:25,883
de projetos
de Wikipedistas em residência.
238
00:15:25,883 --> 00:15:30,472
À medida que íamos avançando,
tornou-se um componente cada vez maior
239
00:15:30,472 --> 00:15:31,849
do que eu estava a fazer.
240
00:15:31,849 --> 00:15:36,350
E comecei a tentar aprender sozinho
também sobre a Wikidata,
241
00:15:36,800 --> 00:15:39,515
porque estava a aperceber-me
do quão importante era.
242
00:15:40,287 --> 00:15:41,989
Então, este projeto em específico...
243
00:15:41,989 --> 00:15:46,325
O kakapo é um papagaio
neozelandês que não voa.
244
00:15:47,816 --> 00:15:51,335
Trabalhámos com
o Departamento de Conservação,
245
00:15:51,335 --> 00:15:54,299
que tem como trabalho salvar
esta espécie de extinção
246
00:15:54,299 --> 00:15:55,643
e demos a ideia:
247
00:15:55,643 --> 00:15:59,253
"E se, pusessemos
cada um dos kakapos na Wikidata?"
248
00:15:59,707 --> 00:16:01,057
(risos)
249
00:16:01,161 --> 00:16:02,701
E isto até pode parecer ridículo,
250
00:16:02,701 --> 00:16:05,580
mas é, na realidade,
um projeto perfeitamente viável.
251
00:16:06,231 --> 00:16:08,427
Alguns já se encontram inclusivamente lá.
252
00:16:09,037 --> 00:16:11,717
Uma coisa chave a reparar
é que não existem assim tantos kakapos.
253
00:16:11,717 --> 00:16:13,245
Por isso, é uma tarefa fazível.
254
00:16:13,245 --> 00:16:16,815
Existiam 148 quando comecei
e depois um morreu.
255
00:16:16,815 --> 00:16:20,995
E agora tiveram uma temporada
de reprodução excelente até aos 213.
256
00:16:21,765 --> 00:16:25,045
Isto é excelente. É o maior número
de kakapos desde há mais de 50 anos.
257
00:16:25,505 --> 00:16:28,260
Por isso,
isto foi também muito importante.
258
00:16:28,260 --> 00:16:30,725
Isto esteve nas notícias,
todos os dias, na Nova Zelândia.
259
00:16:31,285 --> 00:16:33,134
Cada um que nascia...
260
00:16:33,134 --> 00:16:34,414
(plateia 1) No New York Times.
261
00:16:34,414 --> 00:16:35,733
(Mike) A sério? Oh, que bom.
262
00:16:35,803 --> 00:16:38,472
Sim, foram notícias internacionais.
Toda a gente gosta destas aves.
263
00:16:39,002 --> 00:16:40,663
Mas uma coisa interessante sobre eles
264
00:16:40,663 --> 00:16:43,932
é que, ao contrário
de espécies que são mais numerosas,
265
00:16:43,932 --> 00:16:47,822
cada um dos kakapos tem nome,
um nome único
266
00:16:47,822 --> 00:16:49,817
e um número de bilhete de identidade.
267
00:16:49,817 --> 00:16:52,442
E geralmente tem
uma boa quantidade de dados biográficos
268
00:16:52,442 --> 00:16:54,672
sobre onde e quando nasceram,
269
00:16:54,672 --> 00:16:56,972
quando chocaram, quem foi o pai e a mãe,
270
00:16:56,972 --> 00:16:58,713
quando morreram, se morreram.
271
00:16:58,713 --> 00:17:01,352
Existe, de facto, uma base de dados
do Departamento de Conservação
272
00:17:01,352 --> 00:17:02,882
com esta informação toda.
273
00:17:02,882 --> 00:17:06,723
E um dos mais famosos kakapos
é o Sirocco, claro,
274
00:17:06,723 --> 00:17:09,726
que, como podem ver, foi nomeado
a partir de um vento, nasceu ali.
275
00:17:09,726 --> 00:17:13,225
O Sirocco tem uma conta de Twitter,
276
00:17:13,705 --> 00:17:15,927
com a qual a Wikidata
teve alguns problemas,
277
00:17:15,927 --> 00:17:18,562
porque, aparentemente,
pássaros não podem ter contas do Twitter.
278
00:17:18,562 --> 00:17:20,342
Tenho dúvidas sobre isso.
279
00:17:21,051 --> 00:17:23,456
Ele entrou inclusivamente
na capa de um álbum, e por aí fora.
280
00:17:23,456 --> 00:17:25,716
Por isso existem
múltiplas propriedades disto,
281
00:17:25,716 --> 00:17:28,258
provavelmente um dos mais famosos kakapos.
282
00:17:28,258 --> 00:17:30,337
Abordei o Departamento de Conservação,
283
00:17:30,337 --> 00:17:33,245
"Porque é que não tentamos
fazer isto com os outros todos?"
284
00:17:33,245 --> 00:17:38,764
Então, tiveram de pensar em que
dados biográficos podiam tornar públicos.
285
00:17:39,375 --> 00:17:41,375
E voltaram com uma lista bem curta.
286
00:17:41,375 --> 00:17:47,061
E agora temos, penso eu, 212,
210-- penso que um casal morreu--
287
00:17:47,061 --> 00:17:50,394
kakapos vivos todos eles candidatos.
288
00:17:50,394 --> 00:17:52,925
Só lhes é dado um nome quando
as asas se desenvolvem totalmente.
289
00:17:52,925 --> 00:17:55,525
Enquanto são bebés só têm um código.
290
00:17:56,248 --> 00:18:00,130
Portanto, quando
forem todos adultos, vamos criar
291
00:18:00,759 --> 00:18:02,067
uma Wikidata completa...
292
00:18:02,067 --> 00:18:04,108
a espécie completa estará na Wikidata.
293
00:18:04,446 --> 00:18:06,751
Mas precisamos de encontrar
uma propriedade para DOC ID...
294
00:18:06,751 --> 00:18:08,875
Queria mesmo falar convosco acerca disso.
295
00:18:08,875 --> 00:18:11,266
Devemos usar uma ID específica,
296
00:18:11,266 --> 00:18:13,136
ou devemos encontrar uma ID
297
00:18:13,136 --> 00:18:18,245
que seja válida para todos os indivíduos,
sejam eles aves, plantas ou animais
298
00:18:18,245 --> 00:18:21,965
que forem marcados
em algum projeto de pesquisa científica?
299
00:18:21,965 --> 00:18:24,083
É uma boa questão.
300
00:18:25,105 --> 00:18:27,465
O segundo projeto foi
a Galeria de Arte de Christchurch.
301
00:18:28,225 --> 00:18:31,523
Estão lá algumas pinturas
de Colin MacCahon,
302
00:18:31,523 --> 00:18:33,963
o artista neozelandês
mais famoso na História.
303
00:18:33,963 --> 00:18:36,704
Este é um desenho que ele fez
para o New Zealand School Journal,
304
00:18:36,704 --> 00:18:38,424
patrocinado na altura pelo governo.
305
00:18:38,424 --> 00:18:40,704
Por isso, está atualmente
nos Arquivos da Nova Zelândia
306
00:18:40,704 --> 00:18:42,403
que têm o seu copyright.
307
00:18:42,403 --> 00:18:44,333
Esta é uma situação que não é usual.
308
00:18:45,014 --> 00:18:47,073
Trabalhei com
a Galeria de Arte de Christchurch
309
00:18:47,073 --> 00:18:49,117
que, em conjunto
com a Galeria de Arte de Auckland,
310
00:18:49,117 --> 00:18:52,954
mantêm um site chamado
Find New Zealand artists.
311
00:18:52,954 --> 00:18:55,654
Que tem como função
manter o rasto às posses...
312
00:18:55,654 --> 00:18:58,403
cada instituição que
tenha posses de algum artista neozelandês.
313
00:18:58,403 --> 00:19:03,163
Existem perto de 18,000 artistas
diferentes na sua base de dados,
314
00:19:03,163 --> 00:19:05,517
e a maior parte
com muito pouca informação.
315
00:19:06,233 --> 00:19:08,992
Então, fizemos um tipo de
procura standard de Mix'n'Match.
316
00:19:08,992 --> 00:19:13,673
Exportámos os que tinham
pelo menos a data de nascimento,
317
00:19:13,673 --> 00:19:17,665
ou data de morte,
ou local de nascimento, ou local de morte.
318
00:19:17,665 --> 00:19:20,534
Por isso, não é restringir muito.
319
00:19:20,534 --> 00:19:23,484
E mesmo assim, não fomos capazes
de encontrar a correspondência de alguns,
320
00:19:23,484 --> 00:19:25,954
mas agora já temos perto de 1,500
321
00:19:25,954 --> 00:19:28,603
que correspondem
a artistas conhecidos na Wikidata,
322
00:19:28,603 --> 00:19:30,123
o que é muito bom.
323
00:19:30,123 --> 00:19:31,783
Mas o que foi apelativo para eles...
324
00:19:31,783 --> 00:19:33,523
Este é o website deles,
325
00:19:33,523 --> 00:19:39,213
que, na realidade,
só mantém as ligações para os recursos.
326
00:19:39,213 --> 00:19:44,523
Mas estes dados biográficos,
que mantêm atualmente de forma manual,
327
00:19:44,523 --> 00:19:46,063
para todos os artistas.
328
00:19:46,063 --> 00:19:48,803
E o ato de exportar
e colocar no Mix'n'Match
329
00:19:48,803 --> 00:19:53,640
expôs inúmeras gralhas e erros
nos quais eles não tinham reparado.
330
00:19:53,640 --> 00:19:56,123
E é somente quando começas a
executar coisas [em Excel],
331
00:19:56,123 --> 00:19:57,917
que este tipo de situações aparecem.
332
00:19:57,917 --> 00:20:01,720
E o valor da Wikidata
de repente começou a fazer-lhes sentido
333
00:20:01,720 --> 00:20:05,527
quando eu disse, "Podem simplesmente
carregar essa informação da Wikidata."
334
00:20:07,618 --> 00:20:09,507
Isso fê-los
sentarem-se direitos na cadeira.
335
00:20:09,507 --> 00:20:11,748
Por isso, penso eu,
este é um dos pontos que vende.
336
00:20:11,748 --> 00:20:14,907
Quando têm
este website curado à mão
337
00:20:14,907 --> 00:20:19,344
com 18,000 entradas, cheio de erros
e lhes dizem que existe outra forma,
338
00:20:19,344 --> 00:20:20,558
que podem ter outras pessoas
339
00:20:20,558 --> 00:20:23,192
a fazer a verificação dos factos
e correcção por eles...
340
00:20:23,192 --> 00:20:24,813
é quando eles se apercebem.
341
00:20:25,413 --> 00:20:27,293
E depois anunciei que estava a dar a ideia
342
00:20:27,293 --> 00:20:30,313
que eles "Wikidataficassem"
este caderno de história deles,
343
00:20:30,313 --> 00:20:33,333
dos artistas neozelandeses
em Christchurch nos anos 30,
344
00:20:33,333 --> 00:20:36,833
e que percorressem-- só agora publicado--
e que percorressem cada pessoa singular,
345
00:20:36,833 --> 00:20:39,779
cada ligação, local, exibição e afins.
346
00:20:39,779 --> 00:20:43,103
Mas é um projeto de tamanho gerenciável,
e eles estão excitadíssimos com isso.
347
00:20:44,433 --> 00:20:46,963
Em terceiro lugar, queria mostrar-lhes
o Maori Subject Headings.
348
00:20:46,963 --> 00:20:50,811
Waka é um nome Maori
para um tipo particular de canoa,
349
00:20:50,811 --> 00:20:52,732
uma canoa de guerra.
350
00:20:52,732 --> 00:20:55,952
Na Biblioteca Nacional da Nova Zelândia
351
00:20:55,952 --> 00:20:58,530
existe uma lista de waka,
porque a Biblioteca Nacional
352
00:20:58,530 --> 00:21:02,805
tem atualmente o seu próprio
dicionário de Maori Subject Headings,
353
00:21:03,299 --> 00:21:04,474
escrito em Maori.
354
00:21:04,474 --> 00:21:06,475
Então, lá está definida a waka,
355
00:21:08,515 --> 00:21:10,182
em Maori e Inglês.
356
00:21:10,182 --> 00:21:12,540
Mas também tem muitos termos
de terminologia mais reduzida,
357
00:21:12,540 --> 00:21:14,222
podem vê-los ali na lateral.
358
00:21:14,222 --> 00:21:16,062
Uma típica poderia ser taurapa.
359
00:21:16,237 --> 00:21:19,774
E a definição primeiro em maori,
e depois em inglês.
360
00:21:19,774 --> 00:21:22,249
É o mastro esculpido que podem ver ali.
361
00:21:22,695 --> 00:21:24,482
E, em inglês, deveriam dizer "mastro",
362
00:21:24,482 --> 00:21:26,959
mas não podem
usar a palavra "mastro" para taurapa,
363
00:21:26,959 --> 00:21:31,054
porque taurapa só funciona
para modelos únicos de canoas de guerra.
364
00:21:31,420 --> 00:21:34,460
Por isso, não existe
equivalente em inglês para isso.
365
00:21:35,108 --> 00:21:37,909
E, de repente, apercebo-me
que existe uma ontologia inteira
366
00:21:37,909 --> 00:21:42,177
de termos culturais específicos
e que foram cuidadosamente trabalhados
367
00:21:42,177 --> 00:21:45,043
e verificados pela Biblioteca Nacional
com os Maori.
368
00:21:45,043 --> 00:21:49,733
sendo constantemente adicionados
e melhorados com definições e descrições,
369
00:21:49,733 --> 00:21:51,803
em maori e inglês.
370
00:21:51,803 --> 00:21:52,956
Muito interessante.
371
00:21:52,956 --> 00:21:56,228
De repente, pensei que pudessemos
colocar este lote inteiro na Wikidata...
372
00:21:56,228 --> 00:22:00,596
Maori primeiro e depois
traduzido para inglês, como requisitado.
373
00:22:00,596 --> 00:22:02,291
Seria uma boa mudança, não?
374
00:22:03,081 --> 00:22:05,046
E aqui está a cópia de direitos de autor.
375
00:22:05,046 --> 00:22:08,726
Infelizmente, uma licença de
Atribuição-NãoComercial-SemDerivações.
376
00:22:10,346 --> 00:22:12,562
Por isso, agora
vou ter de iniciar a conversa com eles
377
00:22:12,562 --> 00:22:14,524
sobre o porquê
de terem escolhido essa licença.
378
00:22:15,675 --> 00:22:19,970
Muito possivelmente porque
a conseguiram comprar de Maoris,
379
00:22:19,970 --> 00:22:22,679
que aceitaram sentar-se com eles
e vender esta coisa
380
00:22:22,679 --> 00:22:24,039
só se houvesse uma garantia
381
00:22:24,039 --> 00:22:27,339
de que nenhuma dessa informação pudesse
ser utilizada com propósitos comerciais.
382
00:22:28,027 --> 00:22:31,999
Um dos aspetos frustantes da tarefa
383
00:22:31,999 --> 00:22:34,238
é ir contra este tipo de restrições.
384
00:22:34,238 --> 00:22:37,892
Estas eram as três coisas
que queria trazer à discussão.
385
00:22:38,379 --> 00:22:40,878
Pôr uma espécie inteira
dentro da Wikidata,
386
00:22:40,878 --> 00:22:44,107
O que faz alterar a forma de pensar
de um curador de uma galeria de arte
387
00:22:44,107 --> 00:22:46,078
acerca do valor da Wikidata.
388
00:22:46,078 --> 00:22:49,838
E o que fazemos quando vemos
uma ontologia completa
389
00:22:49,838 --> 00:22:52,477
noutra língua que,
infelizmente, foi presenteada
390
00:22:52,477 --> 00:22:55,697
com uma licença
restritiva da Creative Commons.
391
00:22:55,697 --> 00:22:56,997
Obrigado.
392
00:22:56,997 --> 00:23:02,047
(aplausos)
393
00:23:11,412 --> 00:23:13,761
Olá, chamo-me Joachim Neubert.
394
00:23:14,077 --> 00:23:16,472
Trabalho para a ZBW,
395
00:23:17,691 --> 00:23:21,151
que é o Centro de Informação
Económica em Hamburgo,
396
00:23:21,407 --> 00:23:23,796
como programador de software científico.
397
00:23:25,496 --> 00:23:27,662
Uma das minhas tarefas no ano passado
398
00:23:27,662 --> 00:23:31,288
foi preparar
uma doação de dados para a Wikidata.
399
00:23:32,028 --> 00:23:37,303
E quero deixar o meu relato sobre isto,
das nossas primeiras experiências
400
00:23:37,613 --> 00:23:43,259
de doar metadados
dos Arquivos de Imprensa do Século XX.
401
00:23:46,463 --> 00:23:48,299
Que tenhamos conhecimento,
402
00:23:48,299 --> 00:23:52,678
este é o maior arquivo
público de imprensa do mundo.
403
00:23:54,018 --> 00:23:59,158
Foi reunido entre 1908 e 2005,
404
00:24:01,008 --> 00:24:04,244
e foi conseguido a partir de
405
00:24:05,174 --> 00:24:08,995
mais de 1,500 jornais e periódicos
406
00:24:09,614 --> 00:24:13,412
alemães e também internacionais.
407
00:24:14,651 --> 00:24:18,841
E cobre tudo o que possa ser de interesse
408
00:24:18,841 --> 00:24:22,820
para Hamburgo,
409
00:24:25,870 --> 00:24:28,030
para as pessoas de negócios
410
00:24:28,030 --> 00:24:32,410
que quisessem expandir-se pelo mundo.
411
00:24:34,611 --> 00:24:39,350
Como podem ver, este material
foi trazido de jornais
412
00:24:39,350 --> 00:24:41,790
e colocado em papel,
413
00:24:41,790 --> 00:24:44,731
e depois guardados em dossiers.
414
00:24:46,121 --> 00:24:50,451
Aqui podem ver um pequeno canto
do Arquivo de Pessoas.
415
00:24:52,013 --> 00:24:56,182
Informação similar
foi reunida de empresas,
416
00:24:56,182 --> 00:25:00,843
de tópicos gerais,
de artigos, de toda a gente,
417
00:25:01,614 --> 00:25:05,828
de tudo o que pudesse ser interessante.
418
00:25:06,978 --> 00:25:11,074
Estes dossiers foram digitalizados
419
00:25:12,652 --> 00:25:15,692
até mais ou menos 1949
420
00:25:17,076 --> 00:25:23,123
pelo projeto financiado
pelo DFG de 2004 a 2007.
421
00:25:24,268 --> 00:25:30,591
Como resultado, até agora,
foram 25,000 dossiers temáticos
422
00:25:31,727 --> 00:25:33,759
desta altura.
423
00:25:34,131 --> 00:25:38,013
Isto contém perto de 2 milhões
ou mais de 2 milhões de páginas.
424
00:25:38,885 --> 00:25:41,538
E estão online.
425
00:25:43,633 --> 00:25:48,461
Esta aplicação
desenvolvida na altura pela ZBW,
426
00:25:50,006 --> 00:25:54,341
que agora parece um pouco ultrapassada,
427
00:25:55,031 --> 00:25:58,153
não tão bonita e
que agora é mais um problema.
428
00:25:58,597 --> 00:26:04,350
É uma aplicação que foi construída
arquitecturalmente em Oracle,
429
00:26:04,350 --> 00:26:08,662
construída em ColdFusion,
é executada em servidores Windows,
430
00:26:09,227 --> 00:26:14,992
por isso não é
muito sustentável a longo prazo.
431
00:26:16,008 --> 00:26:19,274
E discutimos se devemos migrá-la
432
00:26:19,274 --> 00:26:22,755
para uma melhor aplicação de dados
433
00:26:23,931 --> 00:26:27,964
ou se devemos dar um passo radical
434
00:26:27,964 --> 00:26:31,749
e por os dados todos em aberto.
435
00:26:32,843 --> 00:26:37,416
Atribuímos uma licença CC0 àqueles dados
436
00:26:37,416 --> 00:26:40,938
e, neste momento,
estamos a mover algumas camadas...
437
00:26:42,036 --> 00:26:46,463
algumas camadas de descoberta...
por isso é uma camada primária de acesso,
438
00:26:47,233 --> 00:26:50,587
para uma web de dados abertos ligada
439
00:26:51,315 --> 00:26:56,881
onde faz mais sentido
440
00:26:57,381 --> 00:27:01,298
pôr alguns metadados na Wikidata.
441
00:27:02,380 --> 00:27:07,094
E para garantir que todas as pastas
442
00:27:07,924 --> 00:27:11,183
das coleções estão ligados à Wikidata,
443
00:27:11,485 --> 00:27:13,308
para que possam ser encontradas,
444
00:27:14,240 --> 00:27:17,795
e que a metadata dessas pastas
445
00:27:18,444 --> 00:27:22,977
seja também transferida para a Wikidata.
446
00:27:23,344 --> 00:27:27,886
De forma a que seja usada aí,
e que seja enriquecida lá, possivelmente.
447
00:27:28,780 --> 00:27:32,237
Podem ser feitas correções a esses dados.
448
00:27:32,645 --> 00:27:38,894
O que ainda é mantido pela ZWB é,
claro, o armazenamento de imagens,
449
00:27:39,947 --> 00:27:43,882
que não podemos pôr de qualquer forma,
450
00:27:45,548 --> 00:27:47,326
ou não podemos dar a respetiva licença
451
00:27:47,326 --> 00:27:51,179
porque são propriedade
dos criadores iniciais.
452
00:27:52,271 --> 00:27:54,954
Mas fazermos tudo
para que sejam accessíveis
453
00:27:56,500 --> 00:28:02,203
por alguns
ficheiros de metadados via DFG Viewer.
454
00:28:03,108 --> 00:28:06,108
No futuro, por manifestos de IIIF.
455
00:28:06,849 --> 00:28:11,050
E vamos preparar algumas
páginas estáticas de entrada
456
00:28:11,707 --> 00:28:18,333
que vão servir de ponto de dados
de referência para a Wikidata,
457
00:28:18,333 --> 00:28:22,596
bem como para colocar dados disponíveis
458
00:28:22,600 --> 00:28:26,174
que não encaixam bem na Wikidata.
459
00:28:31,253 --> 00:28:36,815
Para nós, é migração e
doação de dados à Wikidata
460
00:28:37,165 --> 00:28:40,633
com a nossa infraestrutura costumizada
461
00:28:40,633 --> 00:28:44,837
de endpoint SPARQL, com esses dados,
462
00:28:45,887 --> 00:28:48,980
e que nós utilizámos
com consultas federadas
463
00:28:49,990 --> 00:28:53,834
entre o endpoint e
o Wikidata Query Service
464
00:28:53,834 --> 00:28:57,633
para criar declarações de acordo.
465
00:28:59,207 --> 00:29:02,107
Com [os olhos] concatenados
466
00:29:02,107 --> 00:29:06,937
em consultas de SPARQL
ou transformados via script,
467
00:29:07,907 --> 00:29:12,254
que também geraram referências
para as declarações.
468
00:29:12,742 --> 00:29:19,446
E depois, pô-los em QuickStatements
do código para utilizar online.
469
00:29:22,544 --> 00:29:24,268
Então, isto é o que temos.
470
00:29:24,493 --> 00:29:28,669
Não são coisas simples como
datas de nascimento, mas, desculpem...
471
00:29:29,835 --> 00:29:34,998
mas também declarações complexas
472
00:29:34,998 --> 00:29:39,787
sobre alguns itens já existentes,
473
00:29:39,787 --> 00:29:45,010
como esta pessoa que teve um cargo
de Administração de uma dita companhia
474
00:29:46,682 --> 00:29:48,905
durante este período de tempo,
475
00:29:49,663 --> 00:29:57,169
e referênciada para ser utilizada em...
476
00:29:58,463 --> 00:30:01,864
contexto científico.
477
00:30:07,763 --> 00:30:10,939
A primeira parte desta doação de dados
foi terminada.
478
00:30:12,736 --> 00:30:17,201
O Arquivo de Pessoas
está completamente ligado à Wikidata.
479
00:30:18,333 --> 00:30:23,652
E esta é também
uma ferramenta de informação.
480
00:30:23,652 --> 00:30:27,360
Uma boa parte dos itens
que estavam aqui antes
481
00:30:27,360 --> 00:30:30,422
não tinham referências externas.
482
00:30:31,278 --> 00:30:35,674
E tínhamos mais de 6,000 declarações,
483
00:30:36,201 --> 00:30:41,924
que têm agora fontes
nos metadados deste arquivo.
484
00:30:45,288 --> 00:30:49,951
Bem, esta foi a parte mais simples,
485
00:30:50,880 --> 00:30:54,785
porque pessoas
são facilmente identificadas na Wikidata.
486
00:30:56,494 --> 00:30:59,984
Mais de 90% já existia por aqui,
487
00:31:00,443 --> 00:31:02,412
por isso, podíamos fazer as ligações.
488
00:31:02,412 --> 00:31:06,486
Criámos à volta de 100 itens para estes,
489
00:31:06,845 --> 00:31:09,166
para os que estavam a faltar.
490
00:31:09,296 --> 00:31:13,816
Mas agora, estamos a trabalhar
491
00:31:13,824 --> 00:31:18,165
no resto do arquivo,
492
00:31:18,165 --> 00:31:20,432
particularmente no Arquivo de Tópicos.
493
00:31:21,243 --> 00:31:24,803
Isto quer dizer mapear
um sistema histórico
494
00:31:24,803 --> 00:31:29,351
acerca de todo o mundo,
para a organização de conhecimento,
495
00:31:29,884 --> 00:31:34,147
materializado como manchetes
de um jornal na Wikidata.
496
00:31:36,305 --> 00:31:41,898
Para vos dar uma ideia básica,
o arquivo de Países e Tópicos
497
00:31:42,668 --> 00:31:48,773
está organizado
por uma hierarquia de países
498
00:31:48,773 --> 00:31:50,882
e outras entidades geográficas
499
00:31:52,499 --> 00:31:56,453
que estão traduzidas para inglês,
o que torna isto mais simples.
500
00:31:58,543 --> 00:32:01,861
E para alemão profundamente agrupado..
501
00:32:03,881 --> 00:32:08,064
na classificação dos tópicos
profundamente agrupados
502
00:32:08,064 --> 00:32:11,172
E esta combinação define uma...
503
00:32:13,032 --> 00:32:15,870
...uma pasta.
504
00:32:16,289 --> 00:32:21,128
O que queremos fazer agora é mapear isto
505
00:32:21,128 --> 00:32:24,575
como estrutura para
a Wikidata e trazer dados.
506
00:32:26,575 --> 00:32:29,338
Quero convidar-vos
507
00:32:29,338 --> 00:32:33,801
a juntarem-se a este desafio interessante
508
00:32:33,801 --> 00:32:36,272
em termos de organização de conhecimento.
509
00:32:37,739 --> 00:32:40,713
Este trabalho é seguido
num projeto WikiProject,
510
00:32:40,713 --> 00:32:46,288
e podem segui-lo ou participar nele.
511
00:32:46,591 --> 00:32:48,908
E sim, muito obrigado.
512
00:32:49,639 --> 00:32:53,630
(Aplausos)
513
00:33:03,999 --> 00:33:07,284
Estamos a levar
as artes performativas para a Wikidata.
514
00:33:07,735 --> 00:33:11,930
E estamos a levar as artes performativas
à nuvem de dados aberta ligada,
515
00:33:11,930 --> 00:33:14,633
ao construir
um ecossistema ligado e de dados abertos
516
00:33:14,633 --> 00:33:16,320
para as artes performativas.
517
00:33:16,320 --> 00:33:21,157
E a questão que estou a tentar responder,
518
00:33:21,157 --> 00:33:24,712
e espero que me ajudem
a responder a questões
519
00:33:24,712 --> 00:33:27,006
colocadas à Wikidata e a tudo isso.
520
00:33:27,006 --> 00:33:31,433
Mas deixem-me, primeiro,
começar com as minhas experiências
521
00:33:31,733 --> 00:33:34,574
que aconteceram este ano,
522
00:33:34,684 --> 00:33:37,769
no primeiro semestre do ano,
quando tive o prazer
523
00:33:37,769 --> 00:33:39,335
de trabalhar para a CAPACOA,
524
00:33:39,335 --> 00:33:42,227
que é a Associação Canadiana
de Artes Representativas,
525
00:33:42,227 --> 00:33:47,657
que atualmente lançou um projeto chamado
Iniciativa Para o Futuro Digital Ligado,
526
00:33:47,891 --> 00:33:53,195
para conseguir que o setor inteiro de arte
no Canadá abraçasse os dados ligados.
527
00:33:53,777 --> 00:33:56,972
E fizeram isso com base na observação
528
00:33:56,972 --> 00:33:59,200
que, durante os últimos cinco anos,
529
00:33:59,774 --> 00:34:03,981
a necessidade... o tópico importante
dentro das artes performativas
530
00:34:03,981 --> 00:34:08,848
era o facto dos metadados
não terem qualidade suficiente
531
00:34:09,136 --> 00:34:12,250
e não estarem interligados,
não serem interoperacionais.
532
00:34:12,520 --> 00:34:16,532
E isso foi o porquê
de algumas performances,
533
00:34:16,712 --> 00:34:19,248
alguns eventos, não serem
fáceis de encontrar
534
00:34:19,248 --> 00:34:24,779
pelo Google
e pelos assistentes virtuais, etc.
535
00:34:25,967 --> 00:34:29,777
Portanto, a visão que desenvolvemos juntos
536
00:34:30,053 --> 00:34:33,386
é que queremos ter
uma base de dados de conhecimento
537
00:34:33,966 --> 00:34:36,079
para vários intervenientes ao mesmo tempo.
538
00:34:36,079 --> 00:34:39,735
Observámos então o valor
da rede inteira de artes performativas,
539
00:34:40,053 --> 00:34:42,590
identificámos os intervenientes chave,
540
00:34:42,590 --> 00:34:45,930
observámos os cenários de utilização
que queríamos investigar,
541
00:34:47,994 --> 00:34:52,019
e mapeámo-los na arquitetura global
542
00:34:52,267 --> 00:34:56,740
dessa base de dados de conhecimento,
ou das diferentes plataformas,
543
00:34:57,315 --> 00:34:59,671
que é, obviamente,
uma arquitetura distribuída
544
00:34:59,766 --> 00:35:01,703
e não um grande monólito.
545
00:35:02,464 --> 00:35:05,827
Vou só rever isso por alto
546
00:35:05,827 --> 00:35:08,158
porque temos dez minutos para cada.
547
00:35:09,146 --> 00:35:13,682
Mas acho que temos tempo suficiente
entre hoje e amanhã para aprofundar o tema
548
00:35:13,682 --> 00:35:16,350
se houver alguém interessado nos detalhes.
549
00:35:16,350 --> 00:35:19,403
Começámos a partir da
Rede de Valor das Artes Performativas,
550
00:35:19,403 --> 00:35:23,441
que, curiosamente,
só foi publicada o ano passado.
551
00:35:23,441 --> 00:35:27,838
Somos uns sortudos por termos conseguido
construir a partir do trabalho anterior,
552
00:35:27,838 --> 00:35:31,343
por exemplo, temos a corrente de dados
de valor das artes performativas no meio,
553
00:35:31,343 --> 00:35:34,323
e os vários intervenientes à volta disso.
554
00:35:34,388 --> 00:35:37,460
No total, identificámos
20 grupos de intervenientes
555
00:35:37,835 --> 00:35:43,634
que, depois,
reduzimos para sete grandes categorias
556
00:35:43,634 --> 00:35:45,668
para cada grupo de intervenientes.
557
00:35:45,668 --> 00:35:47,228
Nós como que...
558
00:35:48,948 --> 00:35:51,668
formulámos o tipo de necessidades
559
00:35:51,668 --> 00:35:54,772
que teriam nesse tipo de infraestrutura,
560
00:35:54,772 --> 00:35:58,692
e o que teriam de atingir
se o todo estivesse interligado
561
00:35:58,692 --> 00:36:02,192
e os dados estivessem
acessíveis publicamente.
562
00:36:03,030 --> 00:36:04,977
E assim, podem ver os tipos aqui,
563
00:36:05,187 --> 00:36:08,984
os diferentes tipos são Produção,
depois Apresentação & Promoção,
564
00:36:09,274 --> 00:36:11,972
Cobertura & Reutilização,
Audiências ao Vivo
565
00:36:12,152 --> 00:36:15,169
Consumo Online, Herança,
Educação & Pesquisa.
566
00:36:15,959 --> 00:36:18,917
E, depois de preparar
uma tabela tão grande,
567
00:36:18,917 --> 00:36:21,275
da qual só conseguem ver a primeira parte,
568
00:36:21,805 --> 00:36:25,128
comparámos e demos
uma vista de olhos ao tipo de dados
569
00:36:25,128 --> 00:36:26,954
que estávamos a utilizar pelo quadro
570
00:36:26,954 --> 00:36:31,584
pelos diferentes grupos de intervenientes.
571
00:36:31,584 --> 00:36:36,773
Temos uma base de dados
grande que é comum a todos eles,
572
00:36:36,773 --> 00:36:38,614
e é, na realidade, a área
573
00:36:38,614 --> 00:36:43,322
onde faz muito sentido, na verdade,
cooperar e manter esses...
574
00:36:43,503 --> 00:36:46,193
...guardar esses dados juntos.
575
00:36:47,602 --> 00:36:50,651
Então, quando falamos
de arquitetura da plataforma,
576
00:36:51,099 --> 00:36:54,096
podemos ver que temos aqui 4 camadas.
577
00:36:54,096 --> 00:36:56,448
Em baixo, temos a camada dos dados.
578
00:36:56,448 --> 00:36:58,717
Claro, a Wikidata é parte disto,
579
00:36:58,717 --> 00:37:02,733
como também outras bases de dados,
bases de dados distribuidas
580
00:37:02,733 --> 00:37:07,769
que podem expor dados
por endpoints SPARQL.
581
00:37:09,204 --> 00:37:13,422
Na camada amarela do meio,
temos a camada de semântica.
582
00:37:13,422 --> 00:37:16,080
É a nossa linguagem comum
para descrever as nossas coisas,
583
00:37:16,080 --> 00:37:21,944
para fazer declarações acerca
das artes performativas, da ontologia.
584
00:37:22,560 --> 00:37:25,243
Depois temos uma camada aplicacional
585
00:37:25,243 --> 00:37:30,551
que consiste em vários módulos,
por exemplo, análise de dados,
586
00:37:30,551 --> 00:37:34,613
extração de dados, para que
convertamos dados não estruturados
587
00:37:34,613 --> 00:37:36,029
em dados estruturados...
588
00:37:36,029 --> 00:37:39,199
como podemos apoiar isso
com as ferramentas.
589
00:37:39,436 --> 00:37:42,478
Depois, obviamente,
temos a visualização de dados...
590
00:37:42,828 --> 00:37:47,135
se houver grandes quantidades de dados,
queremos visualizá-los de alguma forma.
591
00:37:47,801 --> 00:37:50,155
E no topo, temos a camada de apresentação,
592
00:37:50,155 --> 00:37:54,814
que é onde
os utilizadores comuns estão a interagir
593
00:37:54,814 --> 00:37:56,199
numa base diária...
594
00:37:56,199 --> 00:37:59,615
motores de busca,
enciclopédias, agendas culturais,
595
00:37:59,615 --> 00:38:02,317
e uma variedade de outros serviços.
596
00:38:03,395 --> 00:38:05,386
Não estamos a começar do zero.
597
00:38:05,386 --> 00:38:08,735
Algum do trabalho já foi feito nesta área.
598
00:38:09,107 --> 00:38:13,043
Vou só citar alguns exemplos de um projeto
599
00:38:13,043 --> 00:38:15,295
em que estive envolvido.
600
00:38:15,495 --> 00:38:18,149
E outras coisas a decorrer também.
601
00:38:18,559 --> 00:38:21,195
E como tal, comecei nesta área
602
00:38:21,195 --> 00:38:24,476
com o Arquivo Suíço
de Artes Performativas.
603
00:38:25,001 --> 00:38:27,795
Até construir uma base de dados
Suiça de Artes Performativas,
604
00:38:27,795 --> 00:38:31,046
criámos uma ontologia
de artes performativas,
605
00:38:31,046 --> 00:38:33,931
que está neste momento
a ser implementada em RDF.
606
00:38:35,281 --> 00:38:39,771
E temos ALI uma base de dados
com quase 60, 70 anos
607
00:38:39,771 --> 00:38:43,313
de história de performances na Suiça.
608
00:38:43,313 --> 00:38:45,145
Portanto, isso é algo
que pode ser construído
609
00:38:45,145 --> 00:38:48,999
e foi transformado em formato RDF.
610
00:38:49,968 --> 00:38:54,621
E havia uma plataforma
onde esses dados podem ser acedidos.
611
00:38:56,303 --> 00:39:01,658
Fizemos também
algumas inserções na Wikidata,
612
00:39:01,658 --> 00:39:03,166
parcialmente a partir da Suiça,
613
00:39:03,166 --> 00:39:09,296
também parcialmente a partir
de institutos de artes performativas.
614
00:39:09,680 --> 00:39:12,357
Por exemplo,
Bart Magnus estava envolvido nisso.
615
00:39:12,883 --> 00:39:15,078
Foi a força motriz por trás disso.
616
00:39:15,078 --> 00:39:17,223
Existem também dados de Wikimedia Commons,
617
00:39:17,223 --> 00:39:21,361
mas que não estão muito bem interligados
com o resto dos nossos metadados.
618
00:39:21,671 --> 00:39:25,097
E, obviamente, ao fazer esta inserção,
619
00:39:25,097 --> 00:39:29,274
também começámos a implementar
partes do modelo de dados Suíço
620
00:39:29,274 --> 00:39:31,345
na Wikidata.
621
00:39:32,767 --> 00:39:37,556
Depois, temos um dos parceiros
de implementação Canadianos
622
00:39:37,556 --> 00:39:39,013
que é a Culture Creates.
623
00:39:39,013 --> 00:39:43,872
Estão a gerir uma plataforma
que tira informação de websites de cinema.
624
00:39:44,362 --> 00:39:47,363
e coloca-a dentro
de um gráfico de conhecimento,
625
00:39:48,293 --> 00:39:54,808
para depois a expôr
a motores de busca e outros dispositivos.
626
00:39:58,265 --> 00:40:03,027
Novamente, tivemos de
implementar e estender isto na ontologia.
627
00:40:03,261 --> 00:40:08,163
E, como podem ver pelo slide,
existem muitos espaços em branco,
628
00:40:08,163 --> 00:40:10,038
mas também existem
algumas sobreposições,
629
00:40:10,038 --> 00:40:13,442
e uma sobreposição importante, obviamente,
é a linguagem partilhada comum,
630
00:40:13,456 --> 00:40:18,693
que nos vai ajudar
a interligar os vários blocos de dados.
631
00:40:20,759 --> 00:40:22,587
O que é também importante, obviamente,
632
00:40:22,587 --> 00:40:26,404
é que estamos a utilizar
a mesma base de registo e certificados.
633
00:40:26,406 --> 00:40:31,368
E isto é uma coisa onde a Wikidata
está a ter um papel importante
634
00:40:31,368 --> 00:40:33,967
ao interligar isso.
635
00:40:34,619 --> 00:40:37,619
Agora, quero partilhar as recomendações
636
00:40:37,799 --> 00:40:42,162
do Comité de Aconselhamento para
Iniciativas Futuras de Ligação de Dados.
637
00:40:43,329 --> 00:40:45,169
Pelo menos
as duas primeiras recomendações.
638
00:40:45,169 --> 00:40:47,930
Então, para os Canadianos,
é agora absolutamente crucial
639
00:40:48,110 --> 00:40:53,173
preencher o seu próprio gráfico canadiano
de conhecimento de artes performativas,
640
00:40:53,173 --> 00:40:55,851
porque, ao contrário do Arquivo Suíço
para as Artes Performativas,
641
00:40:55,851 --> 00:40:59,389
eles não estão a começar com
uma base de dados pré-existente,
642
00:40:59,389 --> 00:41:01,906
mas sim a criá-la do zero.
643
00:41:01,906 --> 00:41:04,468
E é absolutamente crucial haver lá dados.
644
00:41:04,468 --> 00:41:09,024
Em segundo lugar,
como podem ver, vem já a Wikidata.
645
00:41:09,024 --> 00:41:12,342
A Wikidata, pelo Comité de Aconselhamento,
646
00:41:12,342 --> 00:41:17,859
foi vista como complemento à Artsdata.ca,
este gráfico de conhecimento,
647
00:41:18,347 --> 00:41:21,474
e, como tal, devem ser feitos
esforços para contribuir
648
00:41:21,474 --> 00:41:24,878
para a introdução de dados relacionados
com artes performativas.
649
00:41:25,813 --> 00:41:30,775
E isso é onde vamos trabalhar
durante os próximos meses e anos
650
00:41:30,775 --> 00:41:34,748
e é também por isso
que estou aqui também a ver
651
00:41:34,748 --> 00:41:38,644
quem se quer juntar a esse esforço.
652
00:41:40,556 --> 00:41:44,942
Por isso, agora, obviamente,
estamos a dizer que se complementam.
653
00:41:44,942 --> 00:41:48,341
Temos de pensar nos prós e contras
654
00:41:48,341 --> 00:41:49,844
de cada uma das abordagens.
655
00:41:49,844 --> 00:41:52,073
Podem ver aqui uma comparação
656
00:41:52,073 --> 00:41:56,500
entre a abordagem da Wikidata e
a da ligação de dados mais clássica.
657
00:41:56,887 --> 00:41:59,947
Estou disponível para discutir isso
em detalhe convosco
658
00:41:59,947 --> 00:42:02,549
e saber como foram
as vossas experiências com isso.
659
00:42:02,814 --> 00:42:07,727
Mas, para mim, a Wikidata tem vantagens
porque é uma plataforma de crowdsourcing,
660
00:42:07,727 --> 00:42:11,671
e porque é fácil
convidar mais gente para contribuir.
661
00:42:11,683 --> 00:42:17,482
Do lado negativo, obviamente,
temos este problema de falta de controlo.
662
00:42:17,658 --> 00:42:22,764
Os donos dos dados têm de abrir mão
dos seus gráficos, qualidade de dados,
663
00:42:22,764 --> 00:42:24,382
e do que completaram.
664
00:42:27,044 --> 00:42:31,096
É difícil fazer o rastreamento da Wikidata
mesmo que esteja sob o vosso controlo.
665
00:42:31,493 --> 00:42:34,376
Outro forte da Wikidata
666
00:42:34,376 --> 00:42:39,617
é que requer integração imediata
com o gráfico global.
667
00:42:39,867 --> 00:42:41,984
E vocês como que, só o fazem...
668
00:42:42,544 --> 00:42:46,768
como que reconciliam passo por passo
contra outras bases de dados,
669
00:42:46,768 --> 00:42:49,528
que pode ser visto
por alguns como uma vantagem,
670
00:42:49,528 --> 00:42:53,914
mas claro, se estão à procura de
integração e interoperacionalidade,
671
00:42:53,914 --> 00:42:56,792
a Wikidata força-vos
a fazer isso desde o inicio.
672
00:42:59,184 --> 00:43:03,157
E depois, claro, harmonizar
as práticas de modelação de dados
673
00:43:03,157 --> 00:43:05,552
é uma situação em ambos os casos.
674
00:43:06,039 --> 00:43:10,671
Mas pode parecer, no inicio,
mais fácil fazê-lo só no vosso silo,
675
00:43:10,671 --> 00:43:13,356
porque, a certa altura,
acabarão a tarefa
676
00:43:13,356 --> 00:43:16,693
e será uma tarefa
que continuará na Wikidata.
677
00:43:18,280 --> 00:43:22,883
Então, quando chegar à parte de
prioritizar os dados para serem inseridos,
678
00:43:23,535 --> 00:43:28,905
é como as regras que tenho neste momento.
679
00:43:30,055 --> 00:43:32,325
Primeiro que tudo, queremos entender
680
00:43:32,325 --> 00:43:36,191
se está claro ou não quem será
a autoridade em determinada área.
681
00:43:36,341 --> 00:43:40,583
Por isso esses serão dados que terão
de ser geridos de forma partilhada.
682
00:43:42,712 --> 00:43:44,956
E queremos entender onde podemos ver
683
00:43:44,956 --> 00:43:47,149
um potencial elevado
para abordagens crowdsourcing.
684
00:43:47,149 --> 00:43:51,693
Queremos também perceber
se os dados poderão ser reutilizados
685
00:43:51,693 --> 00:43:53,965
no contexto da Wikipedia.
686
00:43:54,813 --> 00:44:00,262
E existe também a esperança
que parte da coordenação internacional
687
00:44:00,262 --> 00:44:04,364
à volta de toda a modelação de dados,
sobre a standarização,
688
00:44:04,364 --> 00:44:07,531
possa mesmo ser feita
diretamente na Wikidata
689
00:44:07,531 --> 00:44:09,484
se não estiver a ser feita noutro local,
690
00:44:09,484 --> 00:44:12,220
porque é como que se forçasse as pessoas
a começar a interagir,
691
00:44:12,650 --> 00:44:15,246
se digerirem os dados na mesma parte.
692
00:44:17,293 --> 00:44:22,361
Queremos focar-nos a seguir
nos registos base e ficheiros de controlo,
693
00:44:22,361 --> 00:44:26,085
porque vão ajudar-nos
a fazer as associações
694
00:44:26,085 --> 00:44:29,010
entre diferentes dados
e vocabulário não controlado
695
00:44:29,010 --> 00:44:32,833
como uma extensão
da ontologia já existente.
696
00:44:34,891 --> 00:44:36,480
Só mais dois slides.
697
00:44:36,480 --> 00:44:40,978
Os próximos passos vão ser
levar a soma de todas as abordagens GLAM
698
00:44:40,978 --> 00:44:42,888
para a Wiki Loves Performing Arts.
699
00:44:43,098 --> 00:44:47,524
Isto significa que estamos
a descrever locais e organizações,
700
00:44:47,524 --> 00:44:51,106
e a colocar os dados na Wikipédia
701
00:44:51,106 --> 00:44:54,414
em formato de infoboxes
e templates de bolhas.
702
00:44:54,414 --> 00:44:59,769
E no outro slide, os outros projetos
que vou seguir chamam-se COST Action
703
00:45:00,336 --> 00:45:02,001
que vamos submeter no próximo ano
704
00:45:03,120 --> 00:45:04,430
à volta do Ecosistema de Dados
705
00:45:04,430 --> 00:45:06,307
Abertos Ligados
para as Artes Performativas.
706
00:45:06,307 --> 00:45:10,347
O COST é um programa europeu
que apoia as actividades de redes,
707
00:45:10,347 --> 00:45:13,929
e os tópicos
a serem abrangidos estão listados aqui.
708
00:45:14,549 --> 00:45:16,404
Dois deles, sublinhei-os...
709
00:45:16,924 --> 00:45:20,702
um deles é a questão federativa
entre a Wikidata
710
00:45:20,702 --> 00:45:24,057
e as abordagens clássicas
de dados abertos ligados.
711
00:45:24,768 --> 00:45:27,744
E a outra, penso eu,
que também é muito importante,
712
00:45:27,744 --> 00:45:30,528
onde temos ainda um potencial enorme,
713
00:45:30,528 --> 00:45:35,683
é implementar campanhas internacionais
para dados suplementares na Wikidata.
714
00:45:37,927 --> 00:45:41,365
E é tudo. Muito obrigado
pela vossa atenção.
715
00:45:42,859 --> 00:45:47,912
Agora, queria chamar
aos meus colegas aqui ao painel.
716
00:45:47,912 --> 00:45:50,529
Se calhar
também lhes poderiam arranjar microfones.
717
00:45:53,903 --> 00:45:55,682
E depois queria...
718
00:45:57,473 --> 00:45:59,940
dar-vos a oportunidade
de colocar questões.
719
00:46:01,042 --> 00:46:05,185
E, obviamente, perguntar aos meus colegas
720
00:46:05,753 --> 00:46:08,071
se têm questões uns para os outros.
721
00:46:12,049 --> 00:46:15,327
Então, temos se calhar,
alguma questão do público?
722
00:46:20,502 --> 00:46:22,758
(plateia 2) [inaudível]
723
00:46:23,587 --> 00:46:27,033
Queria perguntar a cada um de vós
724
00:46:27,033 --> 00:46:30,842
onde colocariam limites,
725
00:46:30,842 --> 00:46:33,076
basicamente, como definem...
726
00:46:33,076 --> 00:46:35,956
quando precisam
de fazer a vossa própria Wikibase
727
00:46:35,956 --> 00:46:39,328
e o que querem colocar na Wikidata?
728
00:46:39,328 --> 00:46:43,677
Por exemplo, isto é
uma delimitação clara do que é visto
729
00:46:43,677 --> 00:46:45,981
por detrás do que colocam [na ordem].
730
00:46:48,211 --> 00:46:51,484
Posso responder primeiro
porque tenho o microfone.
731
00:46:52,094 --> 00:46:57,565
Tenho estado a pensar
que um dos assuntos é a notariedade.
732
00:46:59,212 --> 00:47:02,084
Estou a endereçar isso
num projeto diferente.
733
00:47:03,224 --> 00:47:05,898
Penso que o licenciamento é um deles,
734
00:47:05,898 --> 00:47:10,466
porque podem aplicar os vossos termos
na vossa própria base de dados,
735
00:47:10,466 --> 00:47:13,758
e depois, penso,
onde quer que seja possível.
736
00:47:14,284 --> 00:47:19,882
Depois, o terceiro
é tê-los somente como um ensaio,
737
00:47:19,882 --> 00:47:23,078
preparando-os para tratamento na Wikidata.
738
00:47:23,078 --> 00:47:26,085
Estes são os três assuntos principais
de que me lembro, para já,
739
00:47:26,085 --> 00:47:28,554
mas posso trazer-vos mais.
740
00:47:29,976 --> 00:47:32,369
Para mim, os direitos
serão sempre um assunto.
741
00:47:32,849 --> 00:47:36,686
Se a Biblioteca Nacional
quisesse migrar para a Wikibase,
742
00:47:36,686 --> 00:47:39,740
isso poderia habilitá-los
a continuar a controlar o licenciamento
743
00:47:39,740 --> 00:47:42,539
pelo trabalho que têm feito
com os termos da língua maori.
744
00:47:43,438 --> 00:47:46,483
A base de dados kakapo só contém dados
745
00:47:46,483 --> 00:47:49,977
que o Departamento de Conservação
achou que deveria ser tornados públicos,
746
00:47:49,977 --> 00:47:52,739
mas suspeito que se a virem a funcionar,
747
00:47:52,739 --> 00:47:55,980
poderão tentar utilizar
uma Wikibase privada
748
00:47:55,980 --> 00:47:58,128
para manter a sua própria base de dados,
749
00:47:58,128 --> 00:48:01,214
somente porque
algumas das ferramentas de visualização
750
00:48:01,214 --> 00:48:03,567
que poderão ser aplicadas
podem ser melhores
751
00:48:03,567 --> 00:48:07,417
que a espécie de folha de cálculo de Excel
que têm actualmente.
752
00:48:12,337 --> 00:48:16,556
Bem, penso que isto
depende muito do tipo de dados.
753
00:48:17,789 --> 00:48:22,359
Nós estamos, no Arquivo de Imprensa,
claro, numa posição bastante sortuda,
754
00:48:22,359 --> 00:48:26,984
no sentido em que
isto era material que foi publicado,
755
00:48:26,984 --> 00:48:29,829
foi publicado na altura,
756
00:48:30,153 --> 00:48:32,150
mas foi
bastante dispendioso para publicar.
757
00:48:35,132 --> 00:48:36,680
Isto é muito simples.
758
00:48:36,680 --> 00:48:39,449
Penso que, também, projetos...
759
00:48:39,921 --> 00:48:42,476
e isto é um projeto típico,
760
00:48:42,476 --> 00:48:45,726
foi patrocinado por algum tempo,
depois o patrocinio acabou,
761
00:48:46,466 --> 00:48:51,516
e o que aconteceu aos dados,
é que foram colocados num silo,
762
00:48:52,136 --> 00:48:55,106
sobre um software
que não vai correr para sempre.
763
00:48:55,846 --> 00:48:59,436
Por isso, faz sentido absoluto a meu ver.
764
00:48:59,896 --> 00:49:02,776
Na altura, a Wikidata,
não estava por aqui, mas agora está,
765
00:49:03,376 --> 00:49:07,336
e faz sentido
para os nossos projetos, desde cedo,
766
00:49:07,336 --> 00:49:12,732
discutir a sustentabilidade
no contexto de como podemos colocar isto
767
00:49:12,732 --> 00:49:16,617
num ecossistema maior, como a Wikidata
768
00:49:18,017 --> 00:49:21,408
e discutir isto com a comunidade de dados:
769
00:49:21,408 --> 00:49:26,864
o que será importante e fará sentido
ser adicionado à Wikidata,
770
00:49:26,864 --> 00:49:32,093
e o que fará sentido ser mantido
numa forma proprietária.
771
00:49:32,093 --> 00:49:37,753
Se calhar numa forma mais simples
do que numa aplicação sofisticada,
772
00:49:37,753 --> 00:49:43,055
mas estando disponível
e ligado à nuvem de dados maior
773
00:49:43,055 --> 00:49:46,032
ao invés de investirem muito dinheiro
774
00:49:46,032 --> 00:49:53,292
num qualquer silo que não é sustentável.
775
00:49:55,201 --> 00:50:00,121
Sim, como disse antes
no projeto que apresentei aqui,
776
00:50:00,121 --> 00:50:02,206
existem dualidades entre a Wikidata
777
00:50:02,206 --> 00:50:04,926
e as abordagens clássicas
de dados abertos ligados.
778
00:50:04,926 --> 00:50:08,198
Por isso, não é tanto acerca de
como configurar uma Wikibase privada.
779
00:50:11,147 --> 00:50:14,504
É como um desafio que tivemos
e, claro, na Wikidata
780
00:50:14,504 --> 00:50:17,710
é que, quando tratamos
os nossos próprios dados lá,
781
00:50:17,710 --> 00:50:20,341
também temos de fazer alguma manutenção
782
00:50:20,744 --> 00:50:23,509
de pessoas,
de outras pessoas, na realidade.
783
00:50:24,043 --> 00:50:28,258
Isso pode desencorajar as pessoas.
Também quer dizer que nós trataremos disso
784
00:50:28,258 --> 00:50:29,888
passo a passo.
785
00:50:30,375 --> 00:50:33,466
Por isso, existirá, no momento,
uma base de dados a viver...
786
00:50:33,873 --> 00:50:35,581
de dados abertos ligados
de forma clássica.
787
00:50:35,581 --> 00:50:38,395
Nós estamos a começar
a ligá-los à Wikidata
788
00:50:38,395 --> 00:50:40,993
e é um processo contínuo para encontrar
789
00:50:41,805 --> 00:50:47,643
quais as áreas em que
os dados principais ficarão na Wikidata,
790
00:50:48,168 --> 00:50:51,946
e em que áreas ficarão
realmente noutras bases de dados.
791
00:50:52,620 --> 00:50:56,645
Obviamente, teremos desafios
em relação à sincronização,
792
00:50:57,135 --> 00:50:58,589
como todos temos,
793
00:50:58,589 --> 00:51:01,507
porque esse campo de dados ligados,
794
00:51:01,507 --> 00:51:04,826
onde ainda temos
de negociar em quem confiamos,
795
00:51:05,160 --> 00:51:08,720
ou quem tem a autoridade sobre o quê.
796
00:51:13,830 --> 00:51:15,820
(assistente) Mais questões?
797
00:51:23,981 --> 00:51:25,550
(plateia 3) Obrigada.
798
00:51:28,050 --> 00:51:32,190
Concordo plenamente nesse assunto de...
799
00:51:33,275 --> 00:51:36,630
onde colocar essa fronteira
800
00:51:36,630 --> 00:51:41,599
entre o porquê
de pomos dados na Wikidata,
801
00:51:43,044 --> 00:51:49,144
ou porquê ficarmos com eles,
e criá-los, geri-los e mantê-los
802
00:51:49,144 --> 00:51:53,104
em bases de dados locais
e com que propósitos.
803
00:51:53,778 --> 00:51:57,213
E penso que isso é uma grande discussão
804
00:51:57,213 --> 00:52:02,383
que vai para além da excitação
805
00:52:02,383 --> 00:52:07,423
de colocar dados na Wikidata
porque é público,
806
00:52:07,432 --> 00:52:10,762
porque serve a humanidade, porque...
807
00:52:11,031 --> 00:52:13,362
enquanto existem duas ferramentas fixes.
808
00:52:13,362 --> 00:52:18,132
E as coisas são
mais complicadas na vida real, penso eu.
809
00:52:19,162 --> 00:52:24,102
Bem, fora isso,
é uma discussão interessante.
810
00:52:24,435 --> 00:52:29,744
E depois, isto é outra situação,
ou outro problema que está a ser discutido
811
00:52:29,744 --> 00:52:35,479
neste evento, em diferentes painéis.
812
00:52:35,775 --> 00:52:41,129
Por um lado, temos a nossa base de dados,
813
00:52:41,129 --> 00:52:43,194
qualquer que seja a tecnologia,
814
00:52:43,194 --> 00:52:46,763
e publicamos coisas na Wikidata,
815
00:52:47,233 --> 00:52:51,166
ou criamos o nosso sistema
816
00:52:51,166 --> 00:52:55,246
de criação e gestão de informação
817
00:52:55,246 --> 00:52:58,131
com a tecnologia Wikibase.
818
00:52:58,591 --> 00:53:04,281
E depois, sincronizamos ou assim...
unimos ou outra coisa.
819
00:53:04,281 --> 00:53:08,314
Por isso, é uma questão
de tecnologia que é utilizada,
820
00:53:09,182 --> 00:53:14,796
e do facto de usarmos a Wikidata
apenas para publicar,
821
00:53:14,978 --> 00:53:18,637
ou a infraestrutura
que está por baixo da Wikidata,
822
00:53:18,637 --> 00:53:23,002
para criar e gerir os vossos dados.
823
00:53:27,116 --> 00:53:30,914
Quer dizer, tivemos uma discussão
824
00:53:30,914 --> 00:53:34,254
sobre o painel da Wikibase
825
00:53:34,254 --> 00:53:36,912
e haverá outras discussões aqui,
826
00:53:36,912 --> 00:53:40,815
mas as coisas
estão em níveis diferentes, penso eu.
827
00:53:41,626 --> 00:53:47,756
Talvez [tenham] para essa discussão
sobre a Wikibase ou Wikidata...
828
00:53:48,930 --> 00:53:52,427
Penso ser problemático
estarmos a focar-nos tanto
829
00:53:52,427 --> 00:53:56,158
nesta infraestrutura da Wikibase,
porque existem outras infraestruturas,
830
00:53:56,158 --> 00:53:58,690
como na área das artes performativas.
831
00:53:59,810 --> 00:54:04,054
Temos outra comunidade complementar
que é a MusicBrainz
832
00:54:04,054 --> 00:54:08,954
que tem a sua própria plataforma
que disponibiliza dados abertos ligados.
833
00:54:09,614 --> 00:54:12,692
E, de acordo com o que percebi,
834
00:54:14,160 --> 00:54:17,232
existe acordo,
entre a comunidade Wikidata,
835
00:54:17,232 --> 00:54:19,731
de como não duplicaremos os seus dados...
836
00:54:19,731 --> 00:54:24,237
Não copiaremos todos os seus dados,
mas aceitamos que se complementam.
837
00:54:24,848 --> 00:54:29,678
O que irá acontecer quando começarmos
a integrar esses dados na Wikipédia?
838
00:54:30,246 --> 00:54:31,907
Caixas de informação, por exemplo.
839
00:54:31,907 --> 00:54:34,775
Será que vamos ser capazes
de puxar esses dados directamente
840
00:54:34,775 --> 00:54:36,384
do seu endpoint SPARQL?
841
00:54:36,724 --> 00:54:39,603
Ou vamos ser obrigados a,
como que copiar todos os dados,
842
00:54:39,603 --> 00:54:42,225
e que tipo de processos
estarão envolvidos nisso?
843
00:54:42,225 --> 00:54:45,172
(plateia 3) As discussões
estão abertas, penso eu,
844
00:54:45,172 --> 00:54:49,615
porque, neste evento,
temos ambas as comunidades interessadas...
845
00:54:49,615 --> 00:54:51,975
os interessados na Wikibase,
846
00:54:51,975 --> 00:54:54,002
os que estão interessados na Wikidata,
847
00:54:54,002 --> 00:54:56,282
e os que estão interessados em ambos.
848
00:54:56,282 --> 00:54:59,562
Sim, mas não vamos obrigá-los
a migrar para a Wikibase.
849
00:55:00,162 --> 00:55:03,138
- (plateia 3) Não necessariamente.
- A MusicBrainz não corre na Wikibase.
850
00:55:03,138 --> 00:55:06,802
(plateia 3) Não, só queria dizer
que temos problemas separados,
851
00:55:06,802 --> 00:55:10,964
por vezes relacionados,
por vezes não separados completamente.
852
00:55:12,479 --> 00:55:16,573
E tenho outra questão ou reparo
853
00:55:16,573 --> 00:55:22,013
acerca da gestão de hierarquias
em vocabulários controlados,
854
00:55:22,013 --> 00:55:26,473
como thesaurus, ou como você no Finto.
855
00:55:27,703 --> 00:55:30,563
Tem os locais
856
00:55:33,613 --> 00:55:40,391
nos Cabeçalhos de Assuntos Maori.
857
00:55:40,432 --> 00:55:44,212
Bem, eles têm de lidar com...
858
00:55:45,034 --> 00:55:48,139
a gestão de conceitos na hierarquia.
859
00:55:48,164 --> 00:55:51,647
Qual é o seu parecer, a sua opinião,
860
00:55:51,958 --> 00:55:55,221
sobre a possibilidade de gerir
861
00:55:55,221 --> 00:55:58,990
estes sistemas controlados
862
00:55:58,990 --> 00:56:02,292
de organização
de conhecimento na Wikidata?
863
00:56:07,116 --> 00:56:10,864
Penso que no caso do Finto e locais YSO,
864
00:56:13,036 --> 00:56:18,438
o repositório será uma coleção
de várias fontes, eventualmente.
865
00:56:18,978 --> 00:56:21,561
Por isso, está fluído, de qualquer forma.
866
00:56:22,026 --> 00:56:24,598
Não temos de necessariamente...
867
00:56:24,598 --> 00:56:28,305
bem, eu não represento
a Biblioteca Nacional,
868
00:56:28,305 --> 00:56:31,149
mas nesse possível projeto,
869
00:56:31,699 --> 00:56:35,461
não teríamos de manter uma existente...
870
00:56:35,461 --> 00:56:38,230
ou lutar com uma estrutura existente.
871
00:56:38,580 --> 00:56:40,180
Por isso, nesse sentido,
872
00:56:40,329 --> 00:56:42,478
é uma...
873
00:56:42,478 --> 00:56:45,460
uma área aberta a exploração.
874
00:56:48,912 --> 00:56:52,402
Os Cabeçalhos de Assuntos Maori
têm tendência a colocarem-se idealmente
875
00:56:52,402 --> 00:56:56,658
na estrutura Wikidata,
mas o licenciamento, claro, proibe isso.
876
00:56:56,961 --> 00:56:59,491
Suspeito que,
se o licenciamento fosse diferente
877
00:56:59,491 --> 00:57:01,511
e fossem postos na Wikidata,
878
00:57:01,511 --> 00:57:04,562
assim que alguém decidisse
que não gostava da hierarquia
879
00:57:04,562 --> 00:57:06,162
e começasse a alterar coisas,
880
00:57:06,162 --> 00:57:10,331
haveria imediatamente uma reclamação
das pessoas que trabalharam arduamente
881
00:57:10,771 --> 00:57:12,612
para criar essa estrutura
882
00:57:12,612 --> 00:57:15,641
e ter o consentimento
dos diferentes Maori
883
00:57:15,641 --> 00:57:17,942
que estão na hierarquia corrente.
884
00:57:18,382 --> 00:57:21,151
Por isso, é um assunto
a experimentar e resolver.
885
00:57:23,812 --> 00:57:26,502
Penso que, em termos de
sistemas de organização de conhecimento,
886
00:57:26,502 --> 00:57:28,116
são todos diferentes.
887
00:57:28,116 --> 00:57:31,752
E não tenho a certeza
se seria uma boa ideia
888
00:57:31,752 --> 00:57:37,226
representar diferentes hierarquias
na Wikidata como tal,
889
00:57:37,650 --> 00:57:42,850
mas talvez faça sentido
pensar em sobreposições
890
00:57:42,850 --> 00:57:45,431
de dados.
891
00:57:45,721 --> 00:57:48,191
Para fazer mapeamentos
ao nível de conteúdo.
892
00:57:49,371 --> 00:57:54,301
Por exemplo, como a parceria
ZBW Thesaurus para a Economia.
893
00:57:55,950 --> 00:57:59,360
Este dicionário
tem a sua própria hierarquia,
894
00:57:59,680 --> 00:58:04,270
e, claro, seria possível
projectar a hierarquia
895
00:58:04,461 --> 00:58:08,452
desse dicionário nos conceitos da Wikidata
896
00:58:08,452 --> 00:58:11,541
sem armazenar este tipo de estrutura
897
00:58:12,180 --> 00:58:14,840
como uma estrutura
alternativa dentro da Wikidata,
898
00:58:14,840 --> 00:58:18,481
o que faria uma confusão tremenda.
899
00:58:19,111 --> 00:58:24,789
Penso que devíamos pensar da Wikidata,
também, como uma lista de conceitos
900
00:58:24,789 --> 00:58:29,651
que podem ser ligados
em camadas que estão no exterior,
901
00:58:30,264 --> 00:58:33,049
e que dão outra visão do mundo,
902
00:58:33,489 --> 00:58:39,080
que não precisa de estar
necessariamente dentro da Wikidata.
903
00:58:45,775 --> 00:58:48,203
(assistente) Certo. Mais alguma questão?
904
00:58:49,096 --> 00:58:51,527
Ou então... Sim.
905
00:58:54,769 --> 00:58:57,781
(plateia 4) Joachim, queria só
dar seguimento ao último ponto.
906
00:58:58,331 --> 00:59:01,764
Essas camadas, como imaginadas por si,
907
00:59:02,196 --> 00:59:07,354
seriam mantidas externamente
e de alguma forma integradas
908
00:59:08,964 --> 00:59:11,764
com a Wikidata,
a partir do lado da Wikidata,
909
00:59:11,764 --> 00:59:17,143
ou pensou um pouco mais
910
00:59:17,143 --> 00:59:19,463
sobre como isso poderia ser gerido?
911
00:59:22,351 --> 00:59:24,931
Por acaso, não, não pensei...
912
00:59:25,271 --> 00:59:30,361
Fiz experiências com a ZBW e a Wikidata.
913
00:59:30,771 --> 00:59:32,872
Estava preso aqui à Wikidata.
914
00:59:33,252 --> 00:59:38,837
Mas penso que isto é uma coisa
completamente nova e complexa
915
00:59:39,261 --> 00:59:46,210
e, como tal, aberta a discussão
para conseguir concordância
916
00:59:46,409 --> 00:59:47,908
de fazer essas coisas.
917
00:59:48,528 --> 00:59:50,798
Mas terá de ser visto.
918
00:59:56,638 --> 00:59:57,959
Podemos ouvir mais uma?
919
00:59:59,686 --> 01:00:02,628
(plateia 5) Estava a pensar
no projeto kakapo.
920
01:00:03,875 --> 01:00:05,000
(apresentador anuí)
921
01:00:05,000 --> 01:00:10,805
(plateia 5) Teve algum contratempo
da comunidade Wikidata
922
01:00:10,805 --> 01:00:14,636
sobre ter animais reais
fora desses itens?
923
01:00:15,576 --> 01:00:16,836
Não até agora.
924
01:00:16,836 --> 01:00:19,045
(plateia 5) Alguém ouviu isto antes?
925
01:00:19,045 --> 01:00:22,445
Foi "não até agora" porque
ninguém ouviu isto até agora?
926
01:00:23,085 --> 01:00:26,095
Existe uma pequena discussão,
há já algum tempo...
927
01:00:26,095 --> 01:00:29,235
as pessoas interessadas
neste tipo de coisas na Wikidata.
928
01:00:29,235 --> 01:00:32,215
E parece que todos pensamos
que isso é uma extensão natural,
929
01:00:32,215 --> 01:00:35,855
de ter itens individuais da Wikidata,
até um cavalo de corrida famoso
930
01:00:35,855 --> 01:00:39,755
ou o gato de alguém, que...
está bastante bem modelado.
931
01:00:39,764 --> 01:00:44,444
Imagino que a coisa audaciosa é
pôr uma espécie inteira lá.
932
01:00:44,444 --> 01:00:48,113
Mas penso que seja perfeitamente fazível.
933
01:00:48,113 --> 01:00:50,173
(plateia 5) Não tentem com gatos e cães.
934
01:00:50,173 --> 01:00:52,457
(risos)
935
01:00:52,457 --> 01:00:54,622
(assistente) Penso que
o nosso tempo chegou ao fim.
936
01:00:54,622 --> 01:00:56,396
Muito obrigado por terem participado.
937
01:00:56,396 --> 01:00:59,029
Penso que os participantes
ainda estarão disponíveis para questões
938
01:00:59,029 --> 01:01:00,217
e para uma pausa.
939
01:01:00,217 --> 01:01:02,202
- Divirtam-se.
- Muito obrigado.
940
01:01:02,202 --> 01:01:05,032
(aplausos)