WEBVTT
00:00:06.254 --> 00:00:08.249
Boa tarde a todos.
00:00:08.929 --> 00:00:12.068
Bem vindos ao nosso painel GLAM.
00:00:13.124 --> 00:00:17.009
Antes de começarmos,
tenho dois anúncios a fazer.
00:00:17.329 --> 00:00:23.049
Em primeiro lugar, usem exaustivamente
o Etherpad para tirar notas, por favor.
00:00:23.781 --> 00:00:27.998
O segundo é direcionado
para a nossa audiência em casa,
00:00:27.998 --> 00:00:29.819
ou onde quer que estejam.
00:00:29.819 --> 00:00:30.958
Se tiverem alguma questão,
00:00:30.958 --> 00:00:34.028
podem sempre escrever no Etherpad,
00:00:34.028 --> 00:00:37.828
e os nossos anjos na sala
darão seguimento.
00:00:39.328 --> 00:00:44.348
Decidimos que, para o painel deste ano,
00:00:45.388 --> 00:00:48.868
depois de ver
todas as contribuições que foram fazendo,
00:00:49.128 --> 00:00:52.118
que deveríamos focar-nos
no papel de Wikidata
00:00:52.129 --> 00:00:54.297
dentro dos ecossistemas de dados
00:00:54.297 --> 00:00:57.199
para ir além
dos projetos de Wikimedia atuais.
00:00:57.199 --> 00:00:59.987
O que está perfeitamente alinhado
00:00:59.987 --> 00:01:03.732
com a estratégia
da nova Fundação Wikimedia.
00:01:04.652 --> 00:01:07.947
E, hoje, temos quatro oradores.
00:01:08.387 --> 00:01:09.876
Três mais um.
00:01:09.876 --> 00:01:13.636
Por isso, quero pedir-lhes
para subirem ao palco,
00:01:13.636 --> 00:01:15.165
para que vos possa apresentar.
00:01:22.394 --> 00:01:24.895
Temos a Susanna Ånäs.
00:01:25.385 --> 00:01:29.296
Ela é activista
pelo conhecimento livre há muito tempo
00:01:29.296 --> 00:01:31.601
e está envolvida em vários WikiProjects.
00:01:31.916 --> 00:01:35.526
E vai fazer hoje o relatório
do projeto em cooperação
00:01:35.526 --> 00:01:38.396
com a Biblioteca Nacional da Finlândia.
00:01:38.856 --> 00:01:43.435
Depois temos, ao meu lado, Mike Dickison,
00:01:43.435 --> 00:01:46.325
que vai ser o segundo orador.
00:01:46.995 --> 00:01:50.283
Ele é curador num museu na Nova Zelândia.
00:01:50.283 --> 00:01:53.815
É zoólogo e editor da Wikipedia.
00:01:53.815 --> 00:01:58.788
E foi o primeiro Wikipedian
da Nova Zelândia em residência
00:01:58.788 --> 00:02:02.565
em 2018 e 2019.
00:02:02.565 --> 00:02:06.634
Vai contar-nos
sobre a sua experiência neste papel
00:02:06.634 --> 00:02:13.105
e o que está a ser feito
no contexto de trabalho para a Wikidata.
00:02:15.784 --> 00:02:20.480
Depois vamos ter Joachim Neubert
vindo do Centro de Informação
00:02:20.480 --> 00:02:23.461
para a Economia de Leibniz
em Kiel e Hamburgo.
00:02:24.011 --> 00:02:29.131
Esteve a trabalhar para fazer o maior
arquivo público mundial de imprensa
00:02:29.131 --> 00:02:34.655
mais acessível ao público,
e está a utilizar a Wikidata para isso.
00:02:35.890 --> 00:02:38.091
Eu serei o último a falar.
00:02:38.091 --> 00:02:39.468
O meu nome é Beat Estermann.
00:02:39.468 --> 00:02:43.080
Trabalho para a Universidade de Berna
de Ciências Aplicadas, na Suiça.
00:02:43.640 --> 00:02:49.950
Tenho sido um promotor, há muito tempo, da
OpenGLAM na Suiça e Áustria.
00:02:50.975 --> 00:02:55.610
Hoje, falo-vos sobre as minhas atividades
em ligação com o mandato
00:02:55.610 --> 00:02:59.460
da Associação
de Representação de Artes Canadiana,
00:02:59.460 --> 00:03:01.270
focadas nas artes performativas.
00:03:02.121 --> 00:03:04.440
Não principalmente na Wikidata,
00:03:04.510 --> 00:03:08.491
mas verão que a Wikidata está a começar
a ter um papel ativo, também ali.
00:03:08.970 --> 00:03:13.250
Agora, a maior parte de nós
vai sentar-se por aqui,
00:03:13.250 --> 00:03:16.980
e vou dar o palco à Susanna.
00:03:20.680 --> 00:03:23.690
Olá, o meu nome é Susanna Ånäs.
00:03:23.690 --> 00:03:25.769
Trabalho em part-time
para a Wikimedia Finlândia
00:03:25.769 --> 00:03:27.079
como coordenadora para a GLAM
00:03:27.079 --> 00:03:32.655
e faço também consultoria
na esfera do conhecimento livre.
00:03:32.655 --> 00:03:36.049
Este é um discurso, talvez de,
falar da consultoria e não do part-time.
00:03:36.549 --> 00:03:39.219
Tenho estado envolvida em temas
00:03:40.089 --> 00:03:45.539
de grupos de dados geográficos,
00:03:45.539 --> 00:03:48.299
de...
00:03:48.299 --> 00:03:51.147
Bem, fui verificar os termos em Inglês,
00:03:51.147 --> 00:03:54.497
tem a ver com uma iniciativa cultural
hereditária do Governo da Finlândia.
00:03:56.077 --> 00:03:59.752
Isto tem a ver com nomes de locais
00:03:59.752 --> 00:04:03.300
e como são representados
00:04:03.300 --> 00:04:07.466
nos diferentes repositórios
no setor da GLAM na Finlândia
00:04:07.466 --> 00:04:11.755
e como estão a tentar conciliar
as diferentes fontes de informação
00:04:11.755 --> 00:04:17.906
e como estão a informar-se
modelando na Wikidata e outros locais.
00:04:17.906 --> 00:04:23.315
Aqui podemos ver as três grandes fontes
de informação para estes locais YSO,
00:04:23.315 --> 00:04:27.944
que fazem parte
da ontologia nacional, ontologia geral.
00:04:27.944 --> 00:04:29.665
AHAA são os arquivos finlandeses,
00:04:29.665 --> 00:04:31.645
Melinda são as bibliotecas finlandesas,
00:04:31.645 --> 00:04:33.750
e KOOKOS são os museus finlandeses.
00:04:33.750 --> 00:04:37.585
Existem também,
três sistemas de gestão de conteúdo
00:04:37.585 --> 00:04:40.290
que são conciliados nesses locais YSO.
00:04:40.745 --> 00:04:47.365
Existem, também, intercâmbios
entre a Wikidata a funcionar,
00:04:47.965 --> 00:04:53.065
assim como o projeto de nomes
para o Cadastro Nacional de Terrenos.
00:04:53.065 --> 00:04:56.285
E existe um terceiro projeto,
o Arquivo de Nomes Finlandês,
00:04:56.285 --> 00:05:00.391
que ainda não contribui para isto,
00:05:00.391 --> 00:05:02.715
mas existem planos para que o faça.
00:05:02.715 --> 00:05:09.175
Um dos assuntos de modelação
principais nesta área problemática
00:05:09.175 --> 00:05:15.226
é que existem três tipos
de elementos de nomenclatura
00:05:16.116 --> 00:05:18.195
representados neste projeto.
00:05:18.195 --> 00:05:21.236
Um deles é o local,
o que tem a localização.
00:05:21.236 --> 00:05:24.766
E outro é a nomenclatura,
a toponímia, por exemplo.
00:05:25.006 --> 00:05:27.696
Depois, existem as fontes,
que são documentos
00:05:27.696 --> 00:05:30.756
dos quais
os dois anteriores podem derivar,
00:05:30.756 --> 00:05:32.565
ou, serem suportados.
00:05:32.565 --> 00:05:35.845
Os locais YSO,
aqui, no canto superior direito,
00:05:35.845 --> 00:05:38.799
verão o mesmo diagrama de novo.
00:05:38.799 --> 00:05:41.189
Foca-se maioritariamente nos locais.
00:05:42.619 --> 00:05:46.279
O aspecto principal disto
é a Biblioteca Nacional Finlandesa,
00:05:46.279 --> 00:05:49.159
e o Projeto Finto.
00:05:50.199 --> 00:05:55.608
Existem agora mais de 7,000 locais
em finlandês e sueco
00:05:55.608 --> 00:05:59.438
e mais de 3,000 em inglês,
00:05:59.438 --> 00:06:03.042
e são CC0 com quem nós licenciámos.
00:06:03.042 --> 00:06:06.008
Aqui podem ver o serviço do Finto.
00:06:06.008 --> 00:06:09.883
e um local, escolhi Sevettijärvi.
00:06:09.883 --> 00:06:13.908
Está agora também relacionado
com o nosso projeto linguístico
00:06:13.908 --> 00:06:15.268
com o Skolt Sámi...
00:06:15.268 --> 00:06:18.877
É um local no norte longínquo da Finlândia
00:06:18.877 --> 00:06:21.651
habitado por Skolt Sámi.
00:06:22.798 --> 00:06:27.239
Aqui podem ver o local que pertence a...
00:06:28.405 --> 00:06:33.057
Aqui podem ver dados sobre este local.
00:06:33.057 --> 00:06:37.624
Podem ver que está ligado à Wikidata,
00:06:37.624 --> 00:06:42.189
e também a estes dados cartográficos
nacionais.
00:06:43.366 --> 00:06:47.044
Aqui vamos.
E podem ver com mais detalhes, aqui.
00:06:48.996 --> 00:06:52.696
Está também hierarquicamente arranjado
00:06:52.696 --> 00:06:57.405
dentro deste repositório, para que...
00:06:57.580 --> 00:07:00.460
Bem, na realidade,
o local em si não é visto,
00:07:00.460 --> 00:07:05.880
mas está por baixo desta municipalidade,
00:07:05.880 --> 00:07:08.010
como também da região
00:07:08.010 --> 00:07:10.154
e da Finlândia como país
e países nórdicos,
00:07:10.154 --> 00:07:12.650
como região fronteiriça.
00:07:12.650 --> 00:07:14.400
Aqui podem ver que muitos destes
00:07:14.400 --> 00:07:17.891
foram conciliados
com a Wikidata anteriormente
00:07:18.730 --> 00:07:22.230
através de Mix'n'Match,
e que existem ainda alguns remanescentes.
00:07:22.230 --> 00:07:27.900
Mas mesmo assim o número de nomes
não é assim tão alto.
00:07:28.411 --> 00:07:30.844
São menos de 5,000.
00:07:31.570 --> 00:07:33.860
E existe este outro repositório
00:07:33.860 --> 00:07:38.040
propriedade do Projeto
de Plataforma Geoespacial Finlandês...
00:07:38.040 --> 00:07:39.199
Quadros de Nomes de Locais.
00:07:39.199 --> 00:07:41.729
Estes são nomes de locais
que estão no mapa Finlandês.
00:07:42.130 --> 00:07:48.308
E têm os dados ligados,
licenciados como CC BY 4.0.
00:07:48.518 --> 00:07:54.478
800,000 nomes em Finlandês, Sueco
e nas outras três línguas Saami
00:07:54.478 --> 00:07:55.778
que existem na Finlândia.
00:07:55.997 --> 00:07:58.877
Depois têm dois tipos de entidades.
00:07:58.877 --> 00:08:00.680
Outros são locais, e os outros
00:08:00.680 --> 00:08:02.651
são nomes de locais, topónimos.
00:08:02.651 --> 00:08:05.271
Ambos têm URIs
(identificador uniforme de recurso).
00:08:06.001 --> 00:08:09.721
Aqui, por exemplo, o mesmo Sevettijärvi,
primeiro em finlandês,
00:08:09.721 --> 00:08:14.001
e depois nas outras três línguas Saami,
bem como os dados geográficos.
00:08:14.001 --> 00:08:20.526
Por último, temos mais informação
sobre isso, como o tipo de local, etc.
00:08:21.640 --> 00:08:28.641
Aqui, vemos o quadro para o nome do local,
o topónimo, a ter o seu próprio URI.
00:08:29.943 --> 00:08:33.738
Desculpem, parece
que não está traduzido para inglês.
00:08:34.432 --> 00:08:39.151
Então, as multilínguas
não abrangem o projeto inteiro.
00:08:39.847 --> 00:08:42.523
Chegámos ao Arquivo de Nomes Finlandeses.
00:08:42.523 --> 00:08:46.234
Este projeto é
do Instituto de Línguas da Finlândia,
00:08:46.234 --> 00:08:50.456
que não representa locais,
nem os nomes dos locais,
00:08:50.456 --> 00:08:52.603
mas sim a origem disso tudo.
00:08:52.603 --> 00:08:57.123
São três milhões de campos
de notas de nomes de locais,
00:08:57.723 --> 00:08:59.529
e é um projeto Wikibase.
00:08:59.529 --> 00:09:03.325
Estão numa Wikibase, principalmente
em finlandês, mas alguns também em sueco.
00:09:03.325 --> 00:09:08.111
Uma espantosa coleção de nomes em Saami,
nos quais estamos bastante interessados.
00:09:08.111 --> 00:09:10.141
E estão licenciados em CC BY.
00:09:11.540 --> 00:09:14.850
Isto também é um desafio
do ponto de vista da Wikidata.
00:09:14.850 --> 00:09:17.640
Mas se houvesse
uma Wikibase local finlandesa,
00:09:17.640 --> 00:09:22.632
éramos capazes de trabalhar primeiro neles
dentro desse projeto.
00:09:23.034 --> 00:09:25.343
Então, aqui temos uma imagem disso,
00:09:26.443 --> 00:09:31.323
que mostra que existe
informação sobre o local, os mapas...
00:09:31.323 --> 00:09:35.227
dos mapas
que os colectores usaram inicialmente.
00:09:35.227 --> 00:09:40.713
e um quadro que produziram
a partir da informação recolhida.
00:09:41.245 --> 00:09:46.416
Aqui está um desses quadros
00:09:46.416 --> 00:09:48.736
decomposto nos dados
00:09:48.736 --> 00:09:50.676
que está incluído nele.
00:09:51.156 --> 00:09:53.751
Eles enviaram
este projeto de dados sincronizados
00:09:53.751 --> 00:09:58.256
pelo Helsinki Digital Humanities Lab
and Semantic Computers,
00:09:58.256 --> 00:10:01.446
o grupo de computação
da Universidade de Aalto
00:10:01.446 --> 00:10:06.525
em conjunto com o Instituto
para as Línguas da Finlândia...
00:10:06.525 --> 00:10:07.994
o Names Sampo.
00:10:07.994 --> 00:10:11.024
Este é um interface agregado de pesquisa
00:10:11.024 --> 00:10:13.503
para várias fontes de nomes.
00:10:13.503 --> 00:10:17.704
Aqui conseguem ver que
várias das fontes estão aqui à esquerda
00:10:17.704 --> 00:10:20.763
e que podem fazer
vários tipos de visualização
00:10:20.763 --> 00:10:22.653
baseados nestes dados.
00:10:27.259 --> 00:10:30.603
Tenho trazido esta ideia
de modelação para uma Wikibase local
00:10:30.603 --> 00:10:32.683
que poderiamos fazer com estes dados.
00:10:33.133 --> 00:10:36.580
Mas, quando entramos
nestas questões de modelação,
00:10:36.580 --> 00:10:37.770
como o faremos?
00:10:37.770 --> 00:10:41.589
Existem várias formas,
diferentes tradições em cada um deles.
00:10:46.782 --> 00:10:50.360
A boa noticia é que podemos
servir línguas minoritárias
00:10:50.360 --> 00:10:52.475
com muito pouco esforço.
00:10:53.243 --> 00:10:57.179
Então, aqui temos as duas opões básicas:
00:10:57.179 --> 00:11:01.660
o modelo SAPO, que é
a Ontologia Finlandesa Espaço-Tempo,
00:11:02.841 --> 00:11:04.421
e o modelo Wikidata.
00:11:04.421 --> 00:11:07.909
Aqui podem ver que
os itens Wikidata tendem para ser zero.
00:11:07.909 --> 00:11:12.871
Idealmente, permanecem sem alteração
com as propriedades modificadas.
00:11:12.871 --> 00:11:16.909
Enquanto no modelo SAPO,
estes itens tornam-se novos
00:11:16.909 --> 00:11:20.399
quando existe uma modificação,
tal como mudança de área e nome.
00:11:21.179 --> 00:11:26.219
Então, aqui,
voltando atrás para esta divisão
00:11:26.219 --> 00:11:31.719
entre estas três dimensões diferentes
de locais, nomes de locais.
00:11:32.099 --> 00:11:37.659
Devemos colocar estes nomes de locais
em entidades ou propriedades?
00:11:37.659 --> 00:11:39.248
A Wikidata usa propriedades,
00:11:39.248 --> 00:11:43.098
enquanto este projeto
de cartografia utiliza entidades.
00:11:43.838 --> 00:11:46.177
Ou devemos torná-la um lexema?
00:11:46.177 --> 00:11:51.426
A Wikidata escolheu
trabalhar com propriedades,
00:11:51.426 --> 00:11:54.956
propriedades textuais
para nomes de locais ao invés de lexemas.
00:11:55.567 --> 00:11:57.818
Lamento, é o contrário.
00:11:57.818 --> 00:11:59.631
Então, os nomes são...
00:12:03.056 --> 00:12:04.941
propriedades, não lexemas.
00:12:05.874 --> 00:12:06.877
Certo.
00:12:07.425 --> 00:12:11.472
E talvez a falha da Wikibase
00:12:11.472 --> 00:12:16.340
seja a falta
de formas geográficas dentro disso...
00:12:16.340 --> 00:12:20.958
Como a configuração base disso,
00:12:20.958 --> 00:12:24.748
para que cada um possa adicionar
mais tecnologia à pilha
00:12:24.748 --> 00:12:29.865
de forma a poder utilizar
formas geográficas locais.
00:12:29.865 --> 00:12:31.823
O que é realmente preciso
é uma federação
00:12:31.823 --> 00:12:38.328
para se conseguir tirar partido
do colectivo da Wikidata.
00:12:38.758 --> 00:12:43.052
E penso que terminei. Obrigada.
00:12:43.616 --> 00:12:45.530
(orador a rir)
00:12:45.530 --> 00:12:49.057
(aplausos)
00:13:01.115 --> 00:13:02.514
Está bem.
00:13:03.134 --> 00:13:05.011
(orador a falar em maori)
00:13:05.011 --> 00:13:07.655
Bem vindos a todos.
O meu nome é Mike Dickison.
00:13:08.375 --> 00:13:10.149
Por um ano,
00:13:10.149 --> 00:13:13.075
fui o Wikipedista
da Nova Zelândia em residência.
00:13:13.935 --> 00:13:16.935
Devem estar a perguntar-se
o que é um Wikipedista em residência.
00:13:17.856 --> 00:13:21.875
Porque se forem mesmo procurar o que é,
não existe tal termo, como podemos ver.
00:13:22.735 --> 00:13:25.855
É um termo que eu inventei
na proposta de bolsa,
00:13:26.153 --> 00:13:29.003
e do qual a fundação
pareceu gostar imenso.
00:13:29.983 --> 00:13:31.533
E como tal, avançámos com ele.
00:13:32.303 --> 00:13:36.510
Por isso, por um ano,
passei por 35 instituições diferentes,
00:13:37.473 --> 00:13:41.473
tive estagiários, e muitas vezes,
dei sessões de treino.
00:13:41.493 --> 00:13:44.363
Organizei eventos públicos,
e tentei desenvolver
00:13:44.363 --> 00:13:47.230
uma estratégia Wikimedia
para cada um deles.
00:13:47.808 --> 00:13:49.498
Foi uma experiência bastante interessante,
00:13:49.498 --> 00:13:52.997
e encontra-se uma variedade ampla
de diferentes projetos e pessoas.
00:13:53.297 --> 00:13:58.211
Queria tentar falar de alguns
dos diferentes projetos
00:13:58.211 --> 00:14:00.345
que lidaram com a Wikidata
00:14:00.872 --> 00:14:05.171
de formas interessantes ou talvez,
de formas iluminadas,
00:14:05.171 --> 00:14:07.591
que talvez sejam úteis
para as pessoas discutirem.
00:14:08.561 --> 00:14:11.961
O projeto foi inicialmente
um projeto Wikipédia, pelo nome,
00:14:11.961 --> 00:14:14.811
simplesmente porque era com isso
que as pessoas estavam familiarizadas.
00:14:15.281 --> 00:14:18.360
Como tal, organizámos
vários eventos diferentes
00:14:18.360 --> 00:14:23.135
em editatonas bem tradicionais,
trabalho para a igualdade de género, etc.
00:14:24.607 --> 00:14:26.752
E uma quantidade grande de...[inaudível]
00:14:27.410 --> 00:14:30.812
E uma quantidade grande de novos
editores recrutados, bem sucedidos, etc.
00:14:31.754 --> 00:14:34.454
Fizemos carregamentos de volume
para o Commons.
00:14:35.454 --> 00:14:41.246
Neste caso, existia uma coleção
de mais de 1,000 desenhos originais
00:14:41.246 --> 00:14:46.047
feitos por
um ilustrador entomólogo, Des Helmore,
00:14:46.047 --> 00:14:47.927
que estiveram parados
dentro de um disco rígido,
00:14:47.927 --> 00:14:50.357
à espera de pesquisa durante uns 10 anos.
00:14:50.357 --> 00:14:54.182
Conseguimos autorização para os libertar
dentro de uma licença CC BY.
00:14:54.182 --> 00:14:57.963
Sabem como é. Vitórias fáceis
para mostrar às pessoas por lá.
00:14:57.963 --> 00:15:01.095
Qualquer um pode perceber
várias fotografias dos escaravelhos.
00:15:01.095 --> 00:15:06.903
Qualquer um entende workshops dedicadas
a tentar colmatar a igualdade de género.
00:15:07.250 --> 00:15:10.061
Mas a Wikidata
é muito mais difícil de vender
00:15:10.061 --> 00:15:12.696
a pessoas no setor GLAM,
(galerias, bibliotecas, arquivos e museus)
00:15:12.696 --> 00:15:15.095
ou a alguém fora
do nosso movimento tão particular.
00:15:16.107 --> 00:15:19.717
Então, comecei
a aperceber-me que a Wikidata
00:15:19.717 --> 00:15:22.634
ia ser uma parte cada vez mais importante
00:15:22.634 --> 00:15:25.883
de projetos
de Wikipedistas em residência.
00:15:25.883 --> 00:15:30.472
À medida que íamos avançando,
tornou-se um componente cada vez maior
00:15:30.472 --> 00:15:31.849
do que eu estava a fazer.
00:15:31.849 --> 00:15:36.350
E comecei a tentar aprender sozinho
também sobre a Wikidata,
00:15:36.800 --> 00:15:39.515
porque estava a aperceber-me
do quão importante era.
00:15:40.287 --> 00:15:41.989
Então, este projeto em específico...
00:15:41.989 --> 00:15:46.325
O kakapo é um papagaio
neozelandês que não voa.
00:15:47.816 --> 00:15:51.335
Trabalhámos com
o Departamento de Conservação,
00:15:51.335 --> 00:15:54.299
que tem como trabalho salvar
esta espécie de extinção
00:15:54.299 --> 00:15:55.643
e demos a ideia:
00:15:55.643 --> 00:15:59.253
"E se, pusessemos
cada um dos kakapos na Wikidata?"
00:15:59.707 --> 00:16:01.057
(risos)
00:16:01.161 --> 00:16:02.701
E isto até pode parecer ridículo,
00:16:02.701 --> 00:16:05.580
mas é, na realidade,
um projeto perfeitamente viável.
00:16:06.231 --> 00:16:08.427
Alguns já se encontram inclusivamente lá.
00:16:09.037 --> 00:16:11.717
Uma coisa chave a reparar
é que não existem assim tantos kakapos.
00:16:11.717 --> 00:16:13.245
Por isso, é uma tarefa fazível.
00:16:13.245 --> 00:16:16.815
Existiam 148 quando comecei
e depois um morreu.
00:16:16.815 --> 00:16:20.995
E agora tiveram uma temporada
de reprodução excelente até aos 213.
00:16:21.765 --> 00:16:25.045
Isto é excelente. É o maior número
de kakapos desde há mais de 50 anos.
00:16:25.505 --> 00:16:28.260
Por isso,
isto foi também muito importante.
00:16:28.260 --> 00:16:30.725
Isto esteve nas notícias,
todos os dias, na Nova Zelândia.
00:16:31.285 --> 00:16:33.134
Cada um que nascia...
00:16:33.134 --> 00:16:34.414
(plateia 1) No New York Times.
00:16:34.414 --> 00:16:35.733
(Mike) A sério? Oh, que bom.
00:16:35.803 --> 00:16:38.472
Sim, foram notícias internacionais.
Toda a gente gosta destas aves.
00:16:39.002 --> 00:16:40.663
Mas uma coisa interessante sobre eles
00:16:40.663 --> 00:16:43.932
é que, ao contrário
de espécies que são mais numerosas,
00:16:43.932 --> 00:16:47.822
cada um dos kakapos tem nome,
um nome único
00:16:47.822 --> 00:16:49.817
e um número de bilhete de identidade.
00:16:49.817 --> 00:16:52.442
E geralmente tem
uma boa quantidade de dados biográficos
00:16:52.442 --> 00:16:54.672
sobre onde e quando nasceram,
00:16:54.672 --> 00:16:56.972
quando chocaram, quem foi o pai e a mãe,
00:16:56.972 --> 00:16:58.713
quando morreram, se morreram.
00:16:58.713 --> 00:17:01.352
Existe, de facto, uma base de dados
do Departamento de Conservação
00:17:01.352 --> 00:17:02.882
com esta informação toda.
00:17:02.882 --> 00:17:06.723
E um dos mais famosos kakapos
é o Sirocco, claro,
00:17:06.723 --> 00:17:09.726
que, como podem ver, foi nomeado
a partir de um vento, nasceu ali.
00:17:09.726 --> 00:17:13.225
O Sirocco tem uma conta de Twitter,
00:17:13.705 --> 00:17:15.927
com a qual a Wikidata
teve alguns problemas,
00:17:15.927 --> 00:17:18.562
porque, aparentemente,
pássaros não podem ter contas do Twitter.
00:17:18.562 --> 00:17:20.342
Tenho dúvidas sobre isso.
00:17:21.051 --> 00:17:23.456
Ele entrou inclusivamente
na capa de um álbum, e por aí fora.
00:17:23.456 --> 00:17:25.716
Por isso existem
múltiplas propriedades disto,
00:17:25.716 --> 00:17:28.258
provavelmente um dos mais famosos kakapos.
00:17:28.258 --> 00:17:30.337
Abordei o Departamento de Conservação,
00:17:30.337 --> 00:17:33.245
"Porque é que não tentamos
fazer isto com os outros todos?"
00:17:33.245 --> 00:17:38.764
Então, tiveram de pensar em que
dados biográficos podiam tornar públicos.
00:17:39.375 --> 00:17:41.375
E voltaram com uma lista bem curta.
00:17:41.375 --> 00:17:47.061
E agora temos, penso eu, 212,
210-- penso que um casal morreu--
00:17:47.061 --> 00:17:50.394
kakapos vivos todos eles candidatos.
00:17:50.394 --> 00:17:52.925
Só lhes é dado um nome quando
as asas se desenvolvem totalmente.
00:17:52.925 --> 00:17:55.525
Enquanto são bebés só têm um código.
00:17:56.248 --> 00:18:00.130
Portanto, quando
forem todos adultos, vamos criar
00:18:00.759 --> 00:18:02.067
uma Wikidata completa...
00:18:02.067 --> 00:18:04.108
a espécie completa estará na Wikidata.
00:18:04.446 --> 00:18:06.751
Mas precisamos de encontrar
uma propriedade para DOC ID...
00:18:06.751 --> 00:18:08.875
Queria mesmo falar convosco acerca disso.
00:18:08.875 --> 00:18:11.266
Devemos usar uma ID específica,
00:18:11.266 --> 00:18:13.136
ou devemos encontrar uma ID
00:18:13.136 --> 00:18:18.245
que seja válida para todos os indivíduos,
sejam eles aves, plantas ou animais
00:18:18.245 --> 00:18:21.965
que forem marcados
em algum projeto de pesquisa científica?
00:18:21.965 --> 00:18:24.083
É uma boa questão.
00:18:25.105 --> 00:18:27.465
O segundo projeto foi
a Galeria de Arte de Christchurch.
00:18:28.225 --> 00:18:31.523
Estão lá algumas pinturas
de Colin MacCahon,
00:18:31.523 --> 00:18:33.963
o artista neozelandês
mais famoso na História.
00:18:33.963 --> 00:18:36.704
Este é um desenho que ele fez
para o New Zealand School Journal,
00:18:36.704 --> 00:18:38.424
patrocinado na altura pelo governo.
00:18:38.424 --> 00:18:40.704
Por isso, está atualmente
nos Arquivos da Nova Zelândia
00:18:40.704 --> 00:18:42.403
que têm o seu copyright.
00:18:42.403 --> 00:18:44.333
Esta é uma situação que não é usual.
00:18:45.014 --> 00:18:47.073
Trabalhei com
a Galeria de Arte de Christchurch
00:18:47.073 --> 00:18:49.117
que, em conjunto
com a Galeria de Arte de Auckland,
00:18:49.117 --> 00:18:52.954
mantêm um site chamado
Find New Zealand artists.
00:18:52.954 --> 00:18:55.654
Que tem como função
manter o rasto às posses...
00:18:55.654 --> 00:18:58.403
cada instituição que
tenha posses de algum artista neozelandês.
00:18:58.403 --> 00:19:03.163
Existem perto de 18,000 artistas
diferentes na sua base de dados,
00:19:03.163 --> 00:19:05.517
e a maior parte
com muito pouca informação.
00:19:06.233 --> 00:19:08.992
Então, fizemos um tipo de
procura standard de Mix'n'Match.
00:19:08.992 --> 00:19:13.673
Exportámos os que tinham
pelo menos a data de nascimento,
00:19:13.673 --> 00:19:17.665
ou data de morte,
ou local de nascimento, ou local de morte.
00:19:17.665 --> 00:19:20.534
Por isso, não é restringir muito.
00:19:20.534 --> 00:19:23.484
E mesmo assim, não fomos capazes
de encontrar a correspondência de alguns,
00:19:23.484 --> 00:19:25.954
mas agora já temos perto de 1,500
00:19:25.954 --> 00:19:28.603
que correspondem
a artistas conhecidos na Wikidata,
00:19:28.603 --> 00:19:30.123
o que é muito bom.
00:19:30.123 --> 00:19:31.783
Mas o que foi apelativo para eles...
00:19:31.783 --> 00:19:33.523
Este é o website deles,
00:19:33.523 --> 00:19:39.213
que, na realidade,
só mantém as ligações para os recursos.
00:19:39.213 --> 00:19:44.523
Mas estes dados biográficos,
que mantêm atualmente de forma manual,
00:19:44.523 --> 00:19:46.063
para todos os artistas.
00:19:46.063 --> 00:19:48.803
E o ato de exportar
e colocar no Mix'n'Match
00:19:48.803 --> 00:19:53.640
expôs inúmeras gralhas e erros
nos quais eles não tinham reparado.
00:19:53.640 --> 00:19:56.123
E é somente quando começas a
executar coisas [em Excel],
00:19:56.123 --> 00:19:57.917
que este tipo de situações aparecem.
00:19:57.917 --> 00:20:01.720
E o valor da Wikidata
de repente começou a fazer-lhes sentido
00:20:01.720 --> 00:20:05.527
quando eu disse, "Podem simplesmente
carregar essa informação da Wikidata."
00:20:07.618 --> 00:20:09.507
Isso fê-los
sentarem-se direitos na cadeira.
00:20:09.507 --> 00:20:11.748
Por isso, penso eu,
este é um dos pontos que vende.
00:20:11.748 --> 00:20:14.907
Quando têm
este website curado à mão
00:20:14.907 --> 00:20:19.344
com 18,000 entradas, cheio de erros
e lhes dizem que existe outra forma,
00:20:19.344 --> 00:20:20.558
que podem ter outras pessoas
00:20:20.558 --> 00:20:23.192
a fazer a verificação dos factos
e correcção por eles...
00:20:23.192 --> 00:20:24.813
é quando eles se apercebem.
00:20:25.413 --> 00:20:27.293
E depois anunciei que estava a dar a ideia
00:20:27.293 --> 00:20:30.313
que eles "Wikidataficassem"
este caderno de história deles,
00:20:30.313 --> 00:20:33.333
dos artistas neozelandeses
em Christchurch nos anos 30,
00:20:33.333 --> 00:20:36.833
e que percorressem-- só agora publicado--
e que percorressem cada pessoa singular,
00:20:36.833 --> 00:20:39.779
cada ligação, local, exibição e afins.
00:20:39.779 --> 00:20:43.103
Mas é um projeto de tamanho gerenciável,
e eles estão excitadíssimos com isso.
00:20:44.433 --> 00:20:46.963
Em terceiro lugar, queria mostrar-lhes
o Maori Subject Headings.
00:20:46.963 --> 00:20:50.811
Waka é um nome Maori
para um tipo particular de canoa,
00:20:50.811 --> 00:20:52.732
uma canoa de guerra.
00:20:52.732 --> 00:20:55.952
Na Biblioteca Nacional da Nova Zelândia
00:20:55.952 --> 00:20:58.530
existe uma lista de waka,
porque a Biblioteca Nacional
00:20:58.530 --> 00:21:02.805
tem atualmente o seu próprio
dicionário de Maori Subject Headings,
00:21:03.299 --> 00:21:04.474
escrito em Maori.
00:21:04.474 --> 00:21:06.475
Então, lá está definida a waka,
00:21:08.515 --> 00:21:10.182
em Maori e Inglês.
00:21:10.182 --> 00:21:12.540
Mas também tem muitos termos
de terminologia mais reduzida,
00:21:12.540 --> 00:21:14.222
podem vê-los ali na lateral.
00:21:14.222 --> 00:21:16.062
Uma típica poderia ser taurapa.
00:21:16.237 --> 00:21:19.774
E a definição primeiro em maori,
e depois em inglês.
00:21:19.774 --> 00:21:22.249
É o mastro esculpido que podem ver ali.
00:21:22.695 --> 00:21:24.482
E, em inglês, deveriam dizer "mastro",
00:21:24.482 --> 00:21:26.959
mas não podem
usar a palavra "mastro" para taurapa,
00:21:26.959 --> 00:21:31.054
porque taurapa só funciona
para modelos únicos de canoas de guerra.
00:21:31.420 --> 00:21:34.460
Por isso, não existe
equivalente em inglês para isso.
00:21:35.108 --> 00:21:37.909
E, de repente, apercebo-me
que existe uma ontologia inteira
00:21:37.909 --> 00:21:42.177
de termos culturais específicos
e que foram cuidadosamente trabalhados
00:21:42.177 --> 00:21:45.043
e verificados pela Biblioteca Nacional
com os Maori.
00:21:45.043 --> 00:21:49.733
sendo constantemente adicionados
e melhorados com definições e descrições,
00:21:49.733 --> 00:21:51.803
em maori e inglês.
00:21:51.803 --> 00:21:52.956
Muito interessante.
00:21:52.956 --> 00:21:56.228
De repente, pensei que pudessemos
colocar este lote inteiro na Wikidata...
00:21:56.228 --> 00:22:00.596
Maori primeiro e depois
traduzido para inglês, como requisitado.
00:22:00.596 --> 00:22:02.291
Seria uma boa mudança, não?
00:22:03.081 --> 00:22:05.046
E aqui está a cópia de direitos de autor.
00:22:05.046 --> 00:22:08.726
Infelizmente, uma licença de
Atribuição-NãoComercial-SemDerivações.
00:22:10.346 --> 00:22:12.562
Por isso, agora
vou ter de iniciar a conversa com eles
00:22:12.562 --> 00:22:14.524
sobre o porquê
de terem escolhido essa licença.
00:22:15.675 --> 00:22:19.970
Muito possivelmente porque
a conseguiram comprar de Maoris,
00:22:19.970 --> 00:22:22.679
que aceitaram sentar-se com eles
e vender esta coisa
00:22:22.679 --> 00:22:24.039
só se houvesse uma garantia
00:22:24.039 --> 00:22:27.339
de que nenhuma dessa informação pudesse
ser utilizada com propósitos comerciais.
00:22:28.027 --> 00:22:31.999
Um dos aspetos frustantes da tarefa
00:22:31.999 --> 00:22:34.238
é ir contra este tipo de restrições.
00:22:34.238 --> 00:22:37.892
Estas eram as três coisas
que queria trazer à discussão.
00:22:38.379 --> 00:22:40.878
Pôr uma espécie inteira
dentro da Wikidata,
00:22:40.878 --> 00:22:44.107
O que faz alterar a forma de pensar
de um curador de uma galeria de arte
00:22:44.107 --> 00:22:46.078
acerca do valor da Wikidata.
00:22:46.078 --> 00:22:49.838
E o que fazemos quando vemos
uma ontologia completa
00:22:49.838 --> 00:22:52.477
noutra língua que,
infelizmente, foi presenteada
00:22:52.477 --> 00:22:55.697
com uma licença
restritiva da Creative Commons.
00:22:55.697 --> 00:22:56.997
Obrigado.
00:22:56.997 --> 00:23:02.047
(aplausos)
00:23:11.412 --> 00:23:13.761
Olá, chamo-me Joachim Neubert.
00:23:14.077 --> 00:23:16.472
Trabalho para a ZBW,
00:23:17.691 --> 00:23:21.151
que é o Centro de Informação
Económica em Hamburgo,
00:23:21.407 --> 00:23:23.796
como programador de software científico.
00:23:25.496 --> 00:23:27.662
Uma das minhas tarefas no ano passado
00:23:27.662 --> 00:23:31.288
foi preparar
uma doação de dados para a Wikidata.
00:23:32.028 --> 00:23:37.303
E quero deixar o meu relato sobre isto,
das nossas primeiras experiências
00:23:37.613 --> 00:23:43.259
de doar metadados
dos Arquivos de Imprensa do Século XX.
00:23:46.463 --> 00:23:48.299
Que tenhamos conhecimento,
00:23:48.299 --> 00:23:52.678
este é o maior arquivo
público de imprensa do mundo.
00:23:54.018 --> 00:23:59.158
Foi reunido entre 1908 e 2005,
00:24:01.008 --> 00:24:04.244
e foi conseguido a partir de
00:24:05.174 --> 00:24:08.995
mais de 1,500 jornais e periódicos
00:24:09.614 --> 00:24:13.412
alemães e também internacionais.
00:24:14.651 --> 00:24:18.841
E cobre tudo o que possa ser de interesse
00:24:18.841 --> 00:24:22.820
para Hamburgo,
00:24:25.870 --> 00:24:28.030
para as pessoas de negócios
00:24:28.030 --> 00:24:32.410
que quisessem expandir-se pelo mundo.
00:24:34.611 --> 00:24:39.350
Como podem ver, este material
foi trazido de jornais
00:24:39.350 --> 00:24:41.790
e colocado em papel,
00:24:41.790 --> 00:24:44.731
e depois guardados em dossiers.
00:24:46.121 --> 00:24:50.451
Aqui podem ver um pequeno canto
do Arquivo de Pessoas.
00:24:52.013 --> 00:24:56.182
Informação similar
foi reunida de empresas,
00:24:56.182 --> 00:25:00.843
de tópicos gerais,
de artigos, de toda a gente,
00:25:01.614 --> 00:25:05.828
de tudo o que pudesse ser interessante.
00:25:06.978 --> 00:25:11.074
Estes dossiers foram digitalizados
00:25:12.652 --> 00:25:15.692
até mais ou menos 1949
00:25:17.076 --> 00:25:23.123
pelo projeto financiado
pelo DFG de 2004 a 2007.
00:25:24.268 --> 00:25:30.591
Como resultado, até agora,
foram 25,000 dossiers temáticos
00:25:31.727 --> 00:25:33.759
desta altura.
00:25:34.131 --> 00:25:38.013
Isto contém perto de 2 milhões
ou mais de 2 milhões de páginas.
00:25:38.885 --> 00:25:41.538
E estão online.
00:25:43.633 --> 00:25:48.461
Esta aplicação
desenvolvida na altura pela ZBW,
00:25:50.006 --> 00:25:54.341
que agora parece um pouco ultrapassada,
00:25:55.031 --> 00:25:58.153
não tão bonita e
que agora é mais um problema.
00:25:58.597 --> 00:26:04.350
É uma aplicação que foi construída
arquitecturalmente em Oracle,
00:26:04.350 --> 00:26:08.662
construída em ColdFusion,
é executada em servidores Windows,
00:26:09.227 --> 00:26:14.992
por isso não é
muito sustentável a longo prazo.
00:26:16.008 --> 00:26:19.274
E discutimos se devemos migrá-la
00:26:19.274 --> 00:26:22.755
para uma melhor aplicação de dados
00:26:23.931 --> 00:26:27.964
ou se devemos dar um passo radical
00:26:27.964 --> 00:26:31.749
e por os dados todos em aberto.
00:26:32.843 --> 00:26:37.416
Atribuímos uma licença CC0 àqueles dados
00:26:37.416 --> 00:26:40.938
e, neste momento,
estamos a mover algumas camadas...
00:26:42.036 --> 00:26:46.463
algumas camadas de descoberta...
por isso é uma camada primária de acesso,
00:26:47.233 --> 00:26:50.587
para uma web de dados abertos ligada
00:26:51.315 --> 00:26:56.881
onde faz mais sentido
00:26:57.381 --> 00:27:01.298
pôr alguns metadados na Wikidata.
00:27:02.380 --> 00:27:07.094
E para garantir que todas as pastas
00:27:07.924 --> 00:27:11.183
das coleções estão ligados à Wikidata,
00:27:11.485 --> 00:27:13.308
para que possam ser encontradas,
00:27:14.240 --> 00:27:17.795
e que a metadata dessas pastas
00:27:18.444 --> 00:27:22.977
seja também transferida para a Wikidata.
00:27:23.344 --> 00:27:27.886
De forma a que seja usada aí,
e que seja enriquecida lá, possivelmente.
00:27:28.780 --> 00:27:32.237
Podem ser feitas correções a esses dados.
00:27:32.645 --> 00:27:38.894
O que ainda é mantido pela ZWB é,
claro, o armazenamento de imagens,
00:27:39.947 --> 00:27:43.882
que não podemos pôr de qualquer forma,
00:27:45.548 --> 00:27:47.326
ou não podemos dar a respetiva licença
00:27:47.326 --> 00:27:51.179
porque são propriedade
dos criadores iniciais.
00:27:52.271 --> 00:27:54.954
Mas fazermos tudo
para que sejam accessíveis
00:27:56.500 --> 00:28:02.203
por alguns
ficheiros de metadados via DFG Viewer.
00:28:03.108 --> 00:28:06.108
No futuro, por manifestos de IIIF.
00:28:06.849 --> 00:28:11.050
E vamos preparar algumas
páginas estáticas de entrada
00:28:11.707 --> 00:28:18.333
que vão servir de ponto de dados
de referência para a Wikidata,
00:28:18.333 --> 00:28:22.596
bem como para colocar dados disponíveis
00:28:22.600 --> 00:28:26.174
que não encaixam bem na Wikidata.
00:28:31.253 --> 00:28:36.815
Para nós, é migração e
doação de dados à Wikidata
00:28:37.165 --> 00:28:40.633
com a nossa infraestrutura costumizada
00:28:40.633 --> 00:28:44.837
de endpoint SPARQL, com esses dados,
00:28:45.887 --> 00:28:48.980
e que nós utilizámos
com consultas federadas
00:28:49.990 --> 00:28:53.834
entre o endpoint e
o Wikidata Query Service
00:28:53.834 --> 00:28:57.633
para criar declarações de acordo.
00:28:59.207 --> 00:29:02.107
Com [os olhos] concatenados
00:29:02.107 --> 00:29:06.937
em consultas de SPARQL
ou transformados via script,
00:29:07.907 --> 00:29:12.254
que também geraram referências
para as declarações.
00:29:12.742 --> 00:29:19.446
E depois, pô-los em QuickStatements
do código para utilizar online.
00:29:22.544 --> 00:29:24.268
Então, isto é o que temos.
00:29:24.493 --> 00:29:28.669
Não são coisas simples como
datas de nascimento, mas, desculpem...
00:29:29.835 --> 00:29:34.998
mas também declarações complexas
00:29:34.998 --> 00:29:39.787
sobre alguns itens já existentes,
00:29:39.787 --> 00:29:45.010
como esta pessoa que teve um cargo
de Administração de uma dita companhia
00:29:46.682 --> 00:29:48.905
durante este período de tempo,
00:29:49.663 --> 00:29:57.169
e referênciada para ser utilizada em...
00:29:58.463 --> 00:30:01.864
contexto científico.
00:30:07.763 --> 00:30:10.939
A primeira parte desta doação de dados
foi terminada.
00:30:12.736 --> 00:30:17.201
O Arquivo de Pessoas
está completamente ligado à Wikidata.
00:30:18.333 --> 00:30:23.652
E esta é também
uma ferramenta de informação.
00:30:23.652 --> 00:30:27.360
Uma boa parte dos itens
que estavam aqui antes
00:30:27.360 --> 00:30:30.422
não tinham referências externas.
00:30:31.278 --> 00:30:35.674
E tínhamos mais de 6,000 declarações,
00:30:36.201 --> 00:30:41.924
que têm agora fontes
nos metadados deste arquivo.
00:30:45.288 --> 00:30:49.951
Bem, esta foi a parte mais simples,
00:30:50.880 --> 00:30:54.785
porque pessoas
são facilmente identificadas na Wikidata.
00:30:56.494 --> 00:30:59.984
Mais de 90% já existia por aqui,
00:31:00.443 --> 00:31:02.412
por isso, podíamos fazer as ligações.
00:31:02.412 --> 00:31:06.486
Criámos à volta de 100 itens para estes,
00:31:06.845 --> 00:31:09.166
para os que estavam a faltar.
00:31:09.296 --> 00:31:13.816
Mas agora, estamos a trabalhar
00:31:13.824 --> 00:31:18.165
no resto do arquivo,
00:31:18.165 --> 00:31:20.432
particularmente no Arquivo de Tópicos.
00:31:21.243 --> 00:31:24.803
Isto quer dizer mapear
um sistema histórico
00:31:24.803 --> 00:31:29.351
acerca de todo o mundo,
para a organização de conhecimento,
00:31:29.884 --> 00:31:34.147
materializado como manchetes
de um jornal na Wikidata.
00:31:36.305 --> 00:31:41.898
Para vos dar uma ideia básica,
o arquivo de Países e Tópicos
00:31:42.668 --> 00:31:48.773
está organizado
por uma hierarquia de países
00:31:48.773 --> 00:31:50.882
e outras entidades geográficas
00:31:52.499 --> 00:31:56.453
que estão traduzidas para inglês,
o que torna isto mais simples.
00:31:58.543 --> 00:32:01.861
E para alemão profundamente agrupado..
00:32:03.881 --> 00:32:08.064
na classificação dos tópicos
profundamente agrupados
00:32:08.064 --> 00:32:11.172
E esta combinação define uma...
00:32:13.032 --> 00:32:15.870
...uma pasta.
00:32:16.289 --> 00:32:21.128
O que queremos fazer agora é mapear isto
00:32:21.128 --> 00:32:24.575
como estrutura para
a Wikidata e trazer dados.
00:32:26.575 --> 00:32:29.338
Quero convidar-vos
00:32:29.338 --> 00:32:33.801
a juntarem-se a este desafio interessante
00:32:33.801 --> 00:32:36.272
em termos de organização de conhecimento.
00:32:37.739 --> 00:32:40.713
Este trabalho é seguido
num projeto WikiProject,
00:32:40.713 --> 00:32:46.288
e podem segui-lo ou participar nele.
00:32:46.591 --> 00:32:48.908
E sim, muito obrigado.
00:32:49.639 --> 00:32:53.630
(Aplausos)
00:33:03.999 --> 00:33:07.284
Estamos a levar
as artes performativas para a Wikidata.
00:33:07.735 --> 00:33:11.930
E estamos a levar as artes performativas
à nuvem de dados aberta ligada,
00:33:11.930 --> 00:33:14.633
ao construir
um ecossistema ligado e de dados abertos
00:33:14.633 --> 00:33:16.320
para as artes performativas.
00:33:16.320 --> 00:33:21.157
E a questão que estou a tentar responder,
00:33:21.157 --> 00:33:24.712
e espero que me ajudem
a responder a questões
00:33:24.712 --> 00:33:27.006
colocadas à Wikidata e a tudo isso.
00:33:27.006 --> 00:33:31.433
Mas deixem-me, primeiro,
começar com as minhas experiências
00:33:31.733 --> 00:33:34.574
que aconteceram este ano,
00:33:34.684 --> 00:33:37.769
no primeiro semestre do ano,
quando tive o prazer
00:33:37.769 --> 00:33:39.335
de trabalhar para a CAPACOA,
00:33:39.335 --> 00:33:42.227
que é a Associação Canadiana
de Artes Representativas,
00:33:42.227 --> 00:33:47.657
que atualmente lançou um projeto chamado
Iniciativa Para o Futuro Digital Ligado,
00:33:47.891 --> 00:33:53.195
para conseguir que o setor inteiro de arte
no Canadá abraçasse os dados ligados.
00:33:53.777 --> 00:33:56.972
E fizeram isso com base na observação
00:33:56.972 --> 00:33:59.200
que, durante os últimos cinco anos,
00:33:59.774 --> 00:34:03.981
a necessidade... o tópico importante
dentro das artes performativas
00:34:03.981 --> 00:34:08.848
era o facto dos metadados
não terem qualidade suficiente
00:34:09.136 --> 00:34:12.250
e não estarem interligados,
não serem interoperacionais.
00:34:12.520 --> 00:34:16.532
E isso foi o porquê
de algumas performances,
00:34:16.712 --> 00:34:19.248
alguns eventos, não serem
fáceis de encontrar
00:34:19.248 --> 00:34:24.779
pelo Google
e pelos assistentes virtuais, etc.
00:34:25.967 --> 00:34:29.777
Portanto, a visão que desenvolvemos juntos
00:34:30.053 --> 00:34:33.386
é que queremos ter
uma base de dados de conhecimento
00:34:33.966 --> 00:34:36.079
para vários intervenientes ao mesmo tempo.
00:34:36.079 --> 00:34:39.735
Observámos então o valor
da rede inteira de artes performativas,
00:34:40.053 --> 00:34:42.590
identificámos os intervenientes chave,
00:34:42.590 --> 00:34:45.930
observámos os cenários de utilização
que queríamos investigar,
00:34:47.994 --> 00:34:52.019
e mapeámo-los na arquitetura global
00:34:52.267 --> 00:34:56.740
dessa base de dados de conhecimento,
ou das diferentes plataformas,
00:34:57.315 --> 00:34:59.671
que é, obviamente,
uma arquitetura distribuída
00:34:59.766 --> 00:35:01.703
e não um grande monólito.
00:35:02.464 --> 00:35:05.827
Vou só rever isso por alto
00:35:05.827 --> 00:35:08.158
porque temos dez minutos para cada.
00:35:09.146 --> 00:35:13.682
Mas acho que temos tempo suficiente
entre hoje e amanhã para aprofundar o tema
00:35:13.682 --> 00:35:16.350
se houver alguém interessado nos detalhes.
00:35:16.350 --> 00:35:19.403
Começámos a partir da
Rede de Valor das Artes Performativas,
00:35:19.403 --> 00:35:23.441
que, curiosamente,
só foi publicada o ano passado.
00:35:23.441 --> 00:35:27.838
Somos uns sortudos por termos conseguido
construir a partir do trabalho anterior,
00:35:27.838 --> 00:35:31.343
por exemplo, temos a corrente de dados
de valor das artes performativas no meio,
00:35:31.343 --> 00:35:34.323
e os vários intervenientes à volta disso.
00:35:34.388 --> 00:35:37.460
No total, identificámos
20 grupos de intervenientes
00:35:37.835 --> 00:35:43.634
que, depois,
reduzimos para sete grandes categorias
00:35:43.634 --> 00:35:45.668
para cada grupo de intervenientes.
00:35:45.668 --> 00:35:47.228
Nós como que...
00:35:48.948 --> 00:35:51.668
formulámos o tipo de necessidades
00:35:51.668 --> 00:35:54.772
que teriam nesse tipo de infraestrutura,
00:35:54.772 --> 00:35:58.692
e o que teriam de atingir
se o todo estivesse interligado
00:35:58.692 --> 00:36:02.192
e os dados estivessem
acessíveis publicamente.
00:36:03.030 --> 00:36:04.977
E assim, podem ver os tipos aqui,
00:36:05.187 --> 00:36:08.984
os diferentes tipos são Produção,
depois Apresentação & Promoção,
00:36:09.274 --> 00:36:11.972
Cobertura & Reutilização,
Audiências ao Vivo
00:36:12.152 --> 00:36:15.169
Consumo Online, Herança,
Educação & Pesquisa.
00:36:15.959 --> 00:36:18.917
E, depois de preparar
uma tabela tão grande,
00:36:18.917 --> 00:36:21.275
da qual só conseguem ver a primeira parte,
00:36:21.805 --> 00:36:25.128
comparámos e demos
uma vista de olhos ao tipo de dados
00:36:25.128 --> 00:36:26.954
que estávamos a utilizar pelo quadro
00:36:26.954 --> 00:36:31.584
pelos diferentes grupos de intervenientes.
00:36:31.584 --> 00:36:36.773
Temos uma base de dados
grande que é comum a todos eles,
00:36:36.773 --> 00:36:38.614
e é, na realidade, a área
00:36:38.614 --> 00:36:43.322
onde faz muito sentido, na verdade,
cooperar e manter esses...
00:36:43.503 --> 00:36:46.193
...guardar esses dados juntos.
00:36:47.602 --> 00:36:50.651
Então, quando falamos
de arquitetura da plataforma,
00:36:51.099 --> 00:36:54.096
podemos ver que temos aqui 4 camadas.
00:36:54.096 --> 00:36:56.448
Em baixo, temos a camada dos dados.
00:36:56.448 --> 00:36:58.717
Claro, a Wikidata é parte disto,
00:36:58.717 --> 00:37:02.733
como também outras bases de dados,
bases de dados distribuidas
00:37:02.733 --> 00:37:07.769
que podem expor dados
por endpoints SPARQL.
00:37:09.204 --> 00:37:13.422
Na camada amarela do meio,
temos a camada de semântica.
00:37:13.422 --> 00:37:16.080
É a nossa linguagem comum
para descrever as nossas coisas,
00:37:16.080 --> 00:37:21.944
para fazer declarações acerca
das artes performativas, da ontologia.
00:37:22.560 --> 00:37:25.243
Depois temos uma camada aplicacional
00:37:25.243 --> 00:37:30.551
que consiste em vários módulos,
por exemplo, análise de dados,
00:37:30.551 --> 00:37:34.613
extração de dados, para que
convertamos dados não estruturados
00:37:34.613 --> 00:37:36.029
em dados estruturados...
00:37:36.029 --> 00:37:39.199
como podemos apoiar isso
com as ferramentas.
00:37:39.436 --> 00:37:42.478
Depois, obviamente,
temos a visualização de dados...
00:37:42.828 --> 00:37:47.135
se houver grandes quantidades de dados,
queremos visualizá-los de alguma forma.
00:37:47.801 --> 00:37:50.155
E no topo, temos a camada de apresentação,
00:37:50.155 --> 00:37:54.814
que é onde
os utilizadores comuns estão a interagir
00:37:54.814 --> 00:37:56.199
numa base diária...
00:37:56.199 --> 00:37:59.615
motores de busca,
enciclopédias, agendas culturais,
00:37:59.615 --> 00:38:02.317
e uma variedade de outros serviços.
00:38:03.395 --> 00:38:05.386
Não estamos a começar do zero.
00:38:05.386 --> 00:38:08.735
Algum do trabalho já foi feito nesta área.
00:38:09.107 --> 00:38:13.043
Vou só citar alguns exemplos de um projeto
00:38:13.043 --> 00:38:15.295
em que estive envolvido.
00:38:15.495 --> 00:38:18.149
E outras coisas a decorrer também.
00:38:18.559 --> 00:38:21.195
E como tal, comecei nesta área
00:38:21.195 --> 00:38:24.476
com o Arquivo Suíço
de Artes Performativas.
00:38:25.001 --> 00:38:27.795
Até construir uma base de dados
Suiça de Artes Performativas,
00:38:27.795 --> 00:38:31.046
criámos uma ontologia
de artes performativas,
00:38:31.046 --> 00:38:33.931
que está neste momento
a ser implementada em RDF.
00:38:35.281 --> 00:38:39.771
E temos ALI uma base de dados
com quase 60, 70 anos
00:38:39.771 --> 00:38:43.313
de história de performances na Suiça.
00:38:43.313 --> 00:38:45.145
Portanto, isso é algo
que pode ser construído
00:38:45.145 --> 00:38:48.999
e foi transformado em formato RDF.
00:38:49.968 --> 00:38:54.621
E havia uma plataforma
onde esses dados podem ser acedidos.
00:38:56.303 --> 00:39:01.658
Fizemos também
algumas inserções na Wikidata,
00:39:01.658 --> 00:39:03.166
parcialmente a partir da Suiça,
00:39:03.166 --> 00:39:09.296
também parcialmente a partir
de institutos de artes performativas.
00:39:09.680 --> 00:39:12.357
Por exemplo,
Bart Magnus estava envolvido nisso.
00:39:12.883 --> 00:39:15.078
Foi a força motriz por trás disso.
00:39:15.078 --> 00:39:17.223
Existem também dados de Wikimedia Commons,
00:39:17.223 --> 00:39:21.361
mas que não estão muito bem interligados
com o resto dos nossos metadados.
00:39:21.671 --> 00:39:25.097
E, obviamente, ao fazer esta inserção,
00:39:25.097 --> 00:39:29.274
também começámos a implementar
partes do modelo de dados Suíço
00:39:29.274 --> 00:39:31.345
na Wikidata.
00:39:32.767 --> 00:39:37.556
Depois, temos um dos parceiros
de implementação Canadianos
00:39:37.556 --> 00:39:39.013
que é a Culture Creates.
00:39:39.013 --> 00:39:43.872
Estão a gerir uma plataforma
que tira informação de websites de cinema.
00:39:44.362 --> 00:39:47.363
e coloca-a dentro
de um gráfico de conhecimento,
00:39:48.293 --> 00:39:54.808
para depois a expôr
a motores de busca e outros dispositivos.
00:39:58.265 --> 00:40:03.027
Novamente, tivemos de
implementar e estender isto na ontologia.
00:40:03.261 --> 00:40:08.163
E, como podem ver pelo slide,
existem muitos espaços em branco,
00:40:08.163 --> 00:40:10.038
mas também existem
algumas sobreposições,
00:40:10.038 --> 00:40:13.442
e uma sobreposição importante, obviamente,
é a linguagem partilhada comum,
00:40:13.456 --> 00:40:18.693
que nos vai ajudar
a interligar os vários blocos de dados.
00:40:20.759 --> 00:40:22.587
O que é também importante, obviamente,
00:40:22.587 --> 00:40:26.404
é que estamos a utilizar
a mesma base de registo e certificados.
00:40:26.406 --> 00:40:31.368
E isto é uma coisa onde a Wikidata
está a ter um papel importante
00:40:31.368 --> 00:40:33.967
ao interligar isso.
00:40:34.619 --> 00:40:37.619
Agora, quero partilhar as recomendações
00:40:37.799 --> 00:40:42.162
do Comité de Aconselhamento para
Iniciativas Futuras de Ligação de Dados.
00:40:43.329 --> 00:40:45.169
Pelo menos
as duas primeiras recomendações.
00:40:45.169 --> 00:40:47.930
Então, para os Canadianos,
é agora absolutamente crucial
00:40:48.110 --> 00:40:53.173
preencher o seu próprio gráfico canadiano
de conhecimento de artes performativas,
00:40:53.173 --> 00:40:55.851
porque, ao contrário do Arquivo Suíço
para as Artes Performativas,
00:40:55.851 --> 00:40:59.389
eles não estão a começar com
uma base de dados pré-existente,
00:40:59.389 --> 00:41:01.906
mas sim a criá-la do zero.
00:41:01.906 --> 00:41:04.468
E é absolutamente crucial haver lá dados.
00:41:04.468 --> 00:41:09.024
Em segundo lugar,
como podem ver, vem já a Wikidata.
00:41:09.024 --> 00:41:12.342
A Wikidata, pelo Comité de Aconselhamento,
00:41:12.342 --> 00:41:17.859
foi vista como complemento à Artsdata.ca,
este gráfico de conhecimento,
00:41:18.347 --> 00:41:21.474
e, como tal, devem ser feitos
esforços para contribuir
00:41:21.474 --> 00:41:24.878
para a introdução de dados relacionados
com artes performativas.
00:41:25.813 --> 00:41:30.775
E isso é onde vamos trabalhar
durante os próximos meses e anos
00:41:30.775 --> 00:41:34.748
e é também por isso
que estou aqui também a ver
00:41:34.748 --> 00:41:38.644
quem se quer juntar a esse esforço.
00:41:40.556 --> 00:41:44.942
Por isso, agora, obviamente,
estamos a dizer que se complementam.
00:41:44.942 --> 00:41:48.341
Temos de pensar nos prós e contras
00:41:48.341 --> 00:41:49.844
de cada uma das abordagens.
00:41:49.844 --> 00:41:52.073
Podem ver aqui uma comparação
00:41:52.073 --> 00:41:56.500
entre a abordagem da Wikidata e
a da ligação de dados mais clássica.
00:41:56.887 --> 00:41:59.947
Estou disponível para discutir isso
em detalhe convosco
00:41:59.947 --> 00:42:02.549
e saber como foram
as vossas experiências com isso.
00:42:02.814 --> 00:42:07.727
Mas, para mim, a Wikidata tem vantagens
porque é uma plataforma de crowdsourcing,
00:42:07.727 --> 00:42:11.671
e porque é fácil
convidar mais gente para contribuir.
00:42:11.683 --> 00:42:17.482
Do lado negativo, obviamente,
temos este problema de falta de controlo.
00:42:17.658 --> 00:42:22.764
Os donos dos dados têm de abrir mão
dos seus gráficos, qualidade de dados,
00:42:22.764 --> 00:42:24.382
e do que completaram.
00:42:27.044 --> 00:42:31.096
É difícil fazer o rastreamento da Wikidata
mesmo que esteja sob o vosso controlo.
00:42:31.493 --> 00:42:34.376
Outro forte da Wikidata
00:42:34.376 --> 00:42:39.617
é que requer integração imediata
com o gráfico global.
00:42:39.867 --> 00:42:41.984
E vocês como que, só o fazem...
00:42:42.544 --> 00:42:46.768
como que reconciliam passo por passo
contra outras bases de dados,
00:42:46.768 --> 00:42:49.528
que pode ser visto
por alguns como uma vantagem,
00:42:49.528 --> 00:42:53.914
mas claro, se estão à procura de
integração e interoperacionalidade,
00:42:53.914 --> 00:42:56.792
a Wikidata força-vos
a fazer isso desde o inicio.
00:42:59.184 --> 00:43:03.157
E depois, claro, harmonizar
as práticas de modelação de dados
00:43:03.157 --> 00:43:05.552
é uma situação em ambos os casos.
00:43:06.039 --> 00:43:10.671
Mas pode parecer, no inicio,
mais fácil fazê-lo só no vosso silo,
00:43:10.671 --> 00:43:13.356
porque, a certa altura,
acabarão a tarefa
00:43:13.356 --> 00:43:16.693
e será uma tarefa
que continuará na Wikidata.
00:43:18.280 --> 00:43:22.883
Então, quando chegar à parte de
prioritizar os dados para serem inseridos,
00:43:23.535 --> 00:43:28.905
é como as regras que tenho neste momento.
00:43:30.055 --> 00:43:32.325
Primeiro que tudo, queremos entender
00:43:32.325 --> 00:43:36.191
se está claro ou não quem será
a autoridade em determinada área.
00:43:36.341 --> 00:43:40.583
Por isso esses serão dados que terão
de ser geridos de forma partilhada.
00:43:42.712 --> 00:43:44.956
E queremos entender onde podemos ver
00:43:44.956 --> 00:43:47.149
um potencial elevado
para abordagens crowdsourcing.
00:43:47.149 --> 00:43:51.693
Queremos também perceber
se os dados poderão ser reutilizados
00:43:51.693 --> 00:43:53.965
no contexto da Wikipedia.
00:43:54.813 --> 00:44:00.262
E existe também a esperança
que parte da coordenação internacional
00:44:00.262 --> 00:44:04.364
à volta de toda a modelação de dados,
sobre a standarização,
00:44:04.364 --> 00:44:07.531
possa mesmo ser feita
diretamente na Wikidata
00:44:07.531 --> 00:44:09.484
se não estiver a ser feita noutro local,
00:44:09.484 --> 00:44:12.220
porque é como que se forçasse as pessoas
a começar a interagir,
00:44:12.650 --> 00:44:15.246
se digerirem os dados na mesma parte.
00:44:17.293 --> 00:44:22.361
Queremos focar-nos a seguir
nos registos base e ficheiros de controlo,
00:44:22.361 --> 00:44:26.085
porque vão ajudar-nos
a fazer as associações
00:44:26.085 --> 00:44:29.010
entre diferentes dados
e vocabulário não controlado
00:44:29.010 --> 00:44:32.833
como uma extensão
da ontologia já existente.
00:44:34.891 --> 00:44:36.480
Só mais dois slides.
00:44:36.480 --> 00:44:40.978
Os próximos passos vão ser
levar a soma de todas as abordagens GLAM
00:44:40.978 --> 00:44:42.888
para a Wiki Loves Performing Arts.
00:44:43.098 --> 00:44:47.524
Isto significa que estamos
a descrever locais e organizações,
00:44:47.524 --> 00:44:51.106
e a colocar os dados na Wikipédia
00:44:51.106 --> 00:44:54.414
em formato de infoboxes
e templates de bolhas.
00:44:54.414 --> 00:44:59.769
E no outro slide, os outros projetos
que vou seguir chamam-se COST Action
00:45:00.336 --> 00:45:02.001
que vamos submeter no próximo ano
00:45:03.120 --> 00:45:04.430
à volta do Ecosistema de Dados
00:45:04.430 --> 00:45:06.307
Abertos Ligados
para as Artes Performativas.
00:45:06.307 --> 00:45:10.347
O COST é um programa europeu
que apoia as actividades de redes,
00:45:10.347 --> 00:45:13.929
e os tópicos
a serem abrangidos estão listados aqui.
00:45:14.549 --> 00:45:16.404
Dois deles, sublinhei-os...
00:45:16.924 --> 00:45:20.702
um deles é a questão federativa
entre a Wikidata
00:45:20.702 --> 00:45:24.057
e as abordagens clássicas
de dados abertos ligados.
00:45:24.768 --> 00:45:27.744
E a outra, penso eu,
que também é muito importante,
00:45:27.744 --> 00:45:30.528
onde temos ainda um potencial enorme,
00:45:30.528 --> 00:45:35.683
é implementar campanhas internacionais
para dados suplementares na Wikidata.
00:45:37.927 --> 00:45:41.365
E é tudo. Muito obrigado
pela vossa atenção.
00:45:42.859 --> 00:45:47.912
Agora, queria chamar
aos meus colegas aqui ao painel.
00:45:47.912 --> 00:45:50.529
Se calhar
também lhes poderiam arranjar microfones.
00:45:53.903 --> 00:45:55.682
E depois queria...
00:45:57.473 --> 00:45:59.940
dar-vos a oportunidade
de colocar questões.
00:46:01.042 --> 00:46:05.185
E, obviamente, perguntar aos meus colegas
00:46:05.753 --> 00:46:08.071
se têm questões uns para os outros.
00:46:12.049 --> 00:46:15.327
Então, temos se calhar,
alguma questão do público?
00:46:20.502 --> 00:46:22.758
(plateia 2) [inaudível]
00:46:23.587 --> 00:46:27.033
Queria perguntar a cada um de vós
00:46:27.033 --> 00:46:30.842
onde colocariam limites,
00:46:30.842 --> 00:46:33.076
basicamente, como definem...
00:46:33.076 --> 00:46:35.956
quando precisam
de fazer a vossa própria Wikibase
00:46:35.956 --> 00:46:39.328
e o que querem colocar na Wikidata?
00:46:39.328 --> 00:46:43.677
Por exemplo, isto é
uma delimitação clara do que é visto
00:46:43.677 --> 00:46:45.981
por detrás do que colocam [na ordem].
00:46:48.211 --> 00:46:51.484
Posso responder primeiro
porque tenho o microfone.
00:46:52.094 --> 00:46:57.565
Tenho estado a pensar
que um dos assuntos é a notariedade.
00:46:59.212 --> 00:47:02.084
Estou a endereçar isso
num projeto diferente.
00:47:03.224 --> 00:47:05.898
Penso que o licenciamento é um deles,
00:47:05.898 --> 00:47:10.466
porque podem aplicar os vossos termos
na vossa própria base de dados,
00:47:10.466 --> 00:47:13.758
e depois, penso,
onde quer que seja possível.
00:47:14.284 --> 00:47:19.882
Depois, o terceiro
é tê-los somente como um ensaio,
00:47:19.882 --> 00:47:23.078
preparando-os para tratamento na Wikidata.
00:47:23.078 --> 00:47:26.085
Estes são os três assuntos principais
de que me lembro, para já,
00:47:26.085 --> 00:47:28.554
mas posso trazer-vos mais.
00:47:29.976 --> 00:47:32.369
Para mim, os direitos
serão sempre um assunto.
00:47:32.849 --> 00:47:36.686
Se a Biblioteca Nacional
quisesse migrar para a Wikibase,
00:47:36.686 --> 00:47:39.740
isso poderia habilitá-los
a continuar a controlar o licenciamento
00:47:39.740 --> 00:47:42.539
pelo trabalho que têm feito
com os termos da língua maori.
00:47:43.438 --> 00:47:46.483
A base de dados kakapo só contém dados
00:47:46.483 --> 00:47:49.977
que o Departamento de Conservação
achou que deveria ser tornados públicos,
00:47:49.977 --> 00:47:52.739
mas suspeito que se a virem a funcionar,
00:47:52.739 --> 00:47:55.980
poderão tentar utilizar
uma Wikibase privada
00:47:55.980 --> 00:47:58.128
para manter a sua própria base de dados,
00:47:58.128 --> 00:48:01.214
somente porque
algumas das ferramentas de visualização
00:48:01.214 --> 00:48:03.567
que poderão ser aplicadas
podem ser melhores
00:48:03.567 --> 00:48:07.417
que a espécie de folha de cálculo de Excel
que têm actualmente.
00:48:12.337 --> 00:48:16.556
Bem, penso que isto
depende muito do tipo de dados.
00:48:17.789 --> 00:48:22.359
Nós estamos, no Arquivo de Imprensa,
claro, numa posição bastante sortuda,
00:48:22.359 --> 00:48:26.984
no sentido em que
isto era material que foi publicado,
00:48:26.984 --> 00:48:29.829
foi publicado na altura,
00:48:30.153 --> 00:48:32.150
mas foi
bastante dispendioso para publicar.
00:48:35.132 --> 00:48:36.680
Isto é muito simples.
00:48:36.680 --> 00:48:39.449
Penso que, também, projetos...
00:48:39.921 --> 00:48:42.476
e isto é um projeto típico,
00:48:42.476 --> 00:48:45.726
foi patrocinado por algum tempo,
depois o patrocinio acabou,
00:48:46.466 --> 00:48:51.516
e o que aconteceu aos dados,
é que foram colocados num silo,
00:48:52.136 --> 00:48:55.106
sobre um software
que não vai correr para sempre.
00:48:55.846 --> 00:48:59.436
Por isso, faz sentido absoluto a meu ver.
00:48:59.896 --> 00:49:02.776
Na altura, a Wikidata,
não estava por aqui, mas agora está,
00:49:03.376 --> 00:49:07.336
e faz sentido
para os nossos projetos, desde cedo,
00:49:07.336 --> 00:49:12.732
discutir a sustentabilidade
no contexto de como podemos colocar isto
00:49:12.732 --> 00:49:16.617
num ecossistema maior, como a Wikidata
00:49:18.017 --> 00:49:21.408
e discutir isto com a comunidade de dados:
00:49:21.408 --> 00:49:26.864
o que será importante e fará sentido
ser adicionado à Wikidata,
00:49:26.864 --> 00:49:32.093
e o que fará sentido ser mantido
numa forma proprietária.
00:49:32.093 --> 00:49:37.753
Se calhar numa forma mais simples
do que numa aplicação sofisticada,
00:49:37.753 --> 00:49:43.055
mas estando disponível
e ligado à nuvem de dados maior
00:49:43.055 --> 00:49:46.032
ao invés de investirem muito dinheiro
00:49:46.032 --> 00:49:53.292
num qualquer silo que não é sustentável.
00:49:55.201 --> 00:50:00.121
Sim, como disse antes
no projeto que apresentei aqui,
00:50:00.121 --> 00:50:02.206
existem dualidades entre a Wikidata
00:50:02.206 --> 00:50:04.926
e as abordagens clássicas
de dados abertos ligados.
00:50:04.926 --> 00:50:08.198
Por isso, não é tanto acerca de
como configurar uma Wikibase privada.
00:50:11.147 --> 00:50:14.504
É como um desafio que tivemos
e, claro, na Wikidata
00:50:14.504 --> 00:50:17.710
é que, quando tratamos
os nossos próprios dados lá,
00:50:17.710 --> 00:50:20.341
também temos de fazer alguma manutenção
NOTE Paragraph
00:50:20.744 --> 00:50:23.509
de pessoas,
de outras pessoas, na realidade.
00:50:24.043 --> 00:50:28.258
Isso pode desencorajar as pessoas.
Também quer dizer que nós trataremos disso
00:50:28.258 --> 00:50:29.888
passo a passo.
00:50:30.375 --> 00:50:33.466
Por isso, existirá, no momento,
uma base de dados a viver...
00:50:33.873 --> 00:50:35.581
de dados abertos ligados
de forma clássica.
00:50:35.581 --> 00:50:38.395
Nós estamos a começar
a ligá-los à Wikidata
00:50:38.395 --> 00:50:40.993
e é um processo contínuo para encontrar
00:50:41.805 --> 00:50:47.643
quais as áreas em que
os dados principais ficarão na Wikidata,
00:50:48.168 --> 00:50:51.946
e em que áreas ficarão
realmente noutras bases de dados.
00:50:52.620 --> 00:50:56.645
Obviamente, teremos desafios
em relação à sincronização,
00:50:57.135 --> 00:50:58.589
como todos temos,
00:50:58.589 --> 00:51:01.507
porque esse campo de dados ligados,
00:51:01.507 --> 00:51:04.826
onde ainda temos
de negociar em quem confiamos,
00:51:05.160 --> 00:51:08.720
ou quem tem a autoridade sobre o quê.
00:51:13.830 --> 00:51:15.820
(assistente) Mais questões?
00:51:23.981 --> 00:51:25.550
(plateia 3) Obrigada.
00:51:28.050 --> 00:51:32.190
Concordo plenamente nesse assunto de...
00:51:33.275 --> 00:51:36.630
onde colocar essa fronteira
00:51:36.630 --> 00:51:41.599
entre o porquê
de pomos dados na Wikidata,
00:51:43.044 --> 00:51:49.144
ou porquê ficarmos com eles,
e criá-los, geri-los e mantê-los
00:51:49.144 --> 00:51:53.104
em bases de dados locais
e com que propósitos.
00:51:53.778 --> 00:51:57.213
E penso que isso é uma grande discussão
00:51:57.213 --> 00:52:02.383
que vai para além da excitação
00:52:02.383 --> 00:52:07.423
de colocar dados na Wikidata
porque é público,
00:52:07.432 --> 00:52:10.762
porque serve a humanidade, porque...
00:52:11.031 --> 00:52:13.362
enquanto existem duas ferramentas fixes.
00:52:13.362 --> 00:52:18.132
E as coisas são
mais complicadas na vida real, penso eu.
00:52:19.162 --> 00:52:24.102
Bem, fora isso,
é uma discussão interessante.
00:52:24.435 --> 00:52:29.744
E depois, isto é outra situação,
ou outro problema que está a ser discutido
00:52:29.744 --> 00:52:35.479
neste evento, em diferentes painéis.
00:52:35.775 --> 00:52:41.129
Por um lado, temos a nossa base de dados,
00:52:41.129 --> 00:52:43.194
qualquer que seja a tecnologia,
00:52:43.194 --> 00:52:46.763
e publicamos coisas na Wikidata,
00:52:47.233 --> 00:52:51.166
ou criamos o nosso sistema
00:52:51.166 --> 00:52:55.246
de criação e gestão de informação
00:52:55.246 --> 00:52:58.131
com a tecnologia Wikibase.
00:52:58.591 --> 00:53:04.281
E depois, sincronizamos ou assim...
unimos ou outra coisa.
00:53:04.281 --> 00:53:08.314
Por isso, é uma questão
de tecnologia que é utilizada,
00:53:09.182 --> 00:53:14.796
e do facto de usarmos a Wikidata
apenas para publicar,
00:53:14.978 --> 00:53:18.637
ou a infraestrutura
que está por baixo da Wikidata,
00:53:18.637 --> 00:53:23.002
para criar e gerir os vossos dados.
00:53:27.116 --> 00:53:30.914
Quer dizer, tivemos uma discussão
00:53:30.914 --> 00:53:34.254
sobre o painel da Wikibase
00:53:34.254 --> 00:53:36.912
e haverá outras discussões aqui,
00:53:36.912 --> 00:53:40.815
mas as coisas
estão em níveis diferentes, penso eu.
00:53:41.626 --> 00:53:47.756
Talvez [tenham] para essa discussão
sobre a Wikibase ou Wikidata...
00:53:48.930 --> 00:53:52.427
Penso ser problemático
estarmos a focar-nos tanto
00:53:52.427 --> 00:53:56.158
nesta infraestrutura da Wikibase,
porque existem outras infraestruturas,
00:53:56.158 --> 00:53:58.690
como na área das artes performativas.
00:53:59.810 --> 00:54:04.054
Temos outra comunidade complementar
que é a MusicBrainz
00:54:04.054 --> 00:54:08.954
que tem a sua própria plataforma
que disponibiliza dados abertos ligados.
00:54:09.614 --> 00:54:12.692
E, de acordo com o que percebi,
00:54:14.160 --> 00:54:17.232
existe acordo,
entre a comunidade Wikidata,
00:54:17.232 --> 00:54:19.731
de como não duplicaremos os seus dados...
00:54:19.731 --> 00:54:24.237
Não copiaremos todos os seus dados,
mas aceitamos que se complementam.
00:54:24.848 --> 00:54:29.678
O que irá acontecer quando começarmos
a integrar esses dados na Wikipédia?
00:54:30.246 --> 00:54:31.907
Caixas de informação, por exemplo.
00:54:31.907 --> 00:54:34.775
Será que vamos ser capazes
de puxar esses dados directamente
00:54:34.775 --> 00:54:36.384
do seu endpoint SPARQL?
00:54:36.724 --> 00:54:39.603
Ou vamos ser obrigados a,
como que copiar todos os dados,
00:54:39.603 --> 00:54:42.225
e que tipo de processos
estarão envolvidos nisso?
00:54:42.225 --> 00:54:45.172
(plateia 3) As discussões
estão abertas, penso eu,
00:54:45.172 --> 00:54:49.615
porque, neste evento,
temos ambas as comunidades interessadas...
00:54:49.615 --> 00:54:51.975
os interessados na Wikibase,
00:54:51.975 --> 00:54:54.002
os que estão interessados na Wikidata,
00:54:54.002 --> 00:54:56.282
e os que estão interessados em ambos.
00:54:56.282 --> 00:54:59.562
Sim, mas não vamos obrigá-los
a migrar para a Wikibase.
00:55:00.162 --> 00:55:03.138
- (plateia 3) Não necessariamente.
- A MusicBrainz não corre na Wikibase.
00:55:03.138 --> 00:55:06.802
(plateia 3) Não, só queria dizer
que temos problemas separados,
00:55:06.802 --> 00:55:10.964
por vezes relacionados,
por vezes não separados completamente.
00:55:12.479 --> 00:55:16.573
E tenho outra questão ou reparo
00:55:16.573 --> 00:55:22.013
acerca da gestão de hierarquias
em vocabulários controlados,
00:55:22.013 --> 00:55:26.473
como thesaurus, ou como você no Finto.
00:55:27.703 --> 00:55:30.563
Tem os locais
00:55:33.613 --> 00:55:40.391
nos Cabeçalhos de Assuntos Maori.
00:55:40.432 --> 00:55:44.212
Bem, eles têm de lidar com...
00:55:45.034 --> 00:55:48.139
a gestão de conceitos na hierarquia.
00:55:48.164 --> 00:55:51.647
Qual é o seu parecer, a sua opinião,
00:55:51.958 --> 00:55:55.221
sobre a possibilidade de gerir
00:55:55.221 --> 00:55:58.990
estes sistemas controlados
00:55:58.990 --> 00:56:02.292
de organização
de conhecimento na Wikidata?
00:56:07.116 --> 00:56:10.864
Penso que no caso do Finto e locais YSO,
00:56:13.036 --> 00:56:18.438
o repositório será uma coleção
de várias fontes, eventualmente.
00:56:18.978 --> 00:56:21.561
Por isso, está fluído, de qualquer forma.
00:56:22.026 --> 00:56:24.598
Não temos de necessariamente...
00:56:24.598 --> 00:56:28.305
bem, eu não represento
a Biblioteca Nacional,
00:56:28.305 --> 00:56:31.149
mas nesse possível projeto,
00:56:31.699 --> 00:56:35.461
não teríamos de manter uma existente...
00:56:35.461 --> 00:56:38.230
ou lutar com uma estrutura existente.
00:56:38.580 --> 00:56:40.180
Por isso, nesse sentido,
00:56:40.329 --> 00:56:42.478
é uma...
00:56:42.478 --> 00:56:45.460
uma área aberta a exploração.
00:56:48.912 --> 00:56:52.402
Os Cabeçalhos de Assuntos Maori
têm tendência a colocarem-se idealmente
00:56:52.402 --> 00:56:56.658
na estrutura Wikidata,
mas o licenciamento, claro, proibe isso.
00:56:56.961 --> 00:56:59.491
Suspeito que,
se o licenciamento fosse diferente
00:56:59.491 --> 00:57:01.511
e fossem postos na Wikidata,
00:57:01.511 --> 00:57:04.562
assim que alguém decidisse
que não gostava da hierarquia
00:57:04.562 --> 00:57:06.162
e começasse a alterar coisas,
00:57:06.162 --> 00:57:10.331
haveria imediatamente uma reclamação
das pessoas que trabalharam arduamente
00:57:10.771 --> 00:57:12.612
para criar essa estrutura
00:57:12.612 --> 00:57:15.641
e ter o consentimento
dos diferentes Maori
00:57:15.641 --> 00:57:17.942
que estão na hierarquia corrente.
00:57:18.382 --> 00:57:21.151
Por isso, é um assunto
a experimentar e resolver.
00:57:23.812 --> 00:57:26.502
Penso que, em termos de
sistemas de organização de conhecimento,
00:57:26.502 --> 00:57:28.116
são todos diferentes.
00:57:28.116 --> 00:57:31.752
E não tenho a certeza
se seria uma boa ideia
00:57:31.752 --> 00:57:37.226
representar diferentes hierarquias
na Wikidata como tal,
00:57:37.650 --> 00:57:42.850
mas talvez faça sentido
pensar em sobreposições
00:57:42.850 --> 00:57:45.431
de dados.
00:57:45.721 --> 00:57:48.191
Para fazer mapeamentos
ao nível de conteúdo.
00:57:49.371 --> 00:57:54.301
Por exemplo, como a parceria
ZBW Thesaurus para a Economia.
00:57:55.950 --> 00:57:59.360
Este dicionário
tem a sua própria hierarquia,
00:57:59.680 --> 00:58:04.270
e, claro, seria possível
projectar a hierarquia
00:58:04.461 --> 00:58:08.452
desse dicionário nos conceitos da Wikidata
00:58:08.452 --> 00:58:11.541
sem armazenar este tipo de estrutura
00:58:12.180 --> 00:58:14.840
como uma estrutura
alternativa dentro da Wikidata,
00:58:14.840 --> 00:58:18.481
o que faria uma confusão tremenda.
00:58:19.111 --> 00:58:24.789
Penso que devíamos pensar da Wikidata,
também, como uma lista de conceitos
00:58:24.789 --> 00:58:29.651
que podem ser ligados
em camadas que estão no exterior,
00:58:30.264 --> 00:58:33.049
e que dão outra visão do mundo,
00:58:33.489 --> 00:58:39.080
que não precisa de estar
necessariamente dentro da Wikidata.
00:58:45.775 --> 00:58:48.203
(assistente) Certo. Mais alguma questão?
00:58:49.096 --> 00:58:51.527
Ou então... Sim.
00:58:54.769 --> 00:58:57.781
(plateia 4) Joachim, queria só
dar seguimento ao último ponto.
00:58:58.331 --> 00:59:01.764
Essas camadas, como imaginadas por si,
00:59:02.196 --> 00:59:07.354
seriam mantidas externamente
e de alguma forma integradas
00:59:08.964 --> 00:59:11.764
com a Wikidata,
a partir do lado da Wikidata,
00:59:11.764 --> 00:59:17.143
ou pensou um pouco mais
00:59:17.143 --> 00:59:19.463
sobre como isso poderia ser gerido?
00:59:22.351 --> 00:59:24.931
Por acaso, não, não pensei...
00:59:25.271 --> 00:59:30.361
Fiz experiências com a ZBW e a Wikidata.
00:59:30.771 --> 00:59:32.872
Estava preso aqui à Wikidata.
00:59:33.252 --> 00:59:38.837
Mas penso que isto é uma coisa
completamente nova e complexa
00:59:39.261 --> 00:59:46.210
e, como tal, aberta a discussão
para conseguir concordância
00:59:46.409 --> 00:59:47.908
de fazer essas coisas.
00:59:48.528 --> 00:59:50.798
Mas terá de ser visto.
00:59:56.638 --> 00:59:57.959
Podemos ouvir mais uma?
00:59:59.686 --> 01:00:02.628
(plateia 5) Estava a pensar
no projeto kakapo.
01:00:03.875 --> 01:00:05.000
(apresentador anuí)
01:00:05.000 --> 01:00:10.805
(plateia 5) Teve algum contratempo
da comunidade Wikidata
01:00:10.805 --> 01:00:14.636
sobre ter animais reais
fora desses itens?
01:00:15.576 --> 01:00:16.836
Não até agora.
01:00:16.836 --> 01:00:19.045
(plateia 5) Alguém ouviu isto antes?
01:00:19.045 --> 01:00:22.445
Foi "não até agora" porque
ninguém ouviu isto até agora?
01:00:23.085 --> 01:00:26.095
Existe uma pequena discussão,
há já algum tempo...
01:00:26.095 --> 01:00:29.235
as pessoas interessadas
neste tipo de coisas na Wikidata.
01:00:29.235 --> 01:00:32.215
E parece que todos pensamos
que isso é uma extensão natural,
01:00:32.215 --> 01:00:35.855
de ter itens individuais da Wikidata,
até um cavalo de corrida famoso
01:00:35.855 --> 01:00:39.755
ou o gato de alguém, que...
está bastante bem modelado.
01:00:39.764 --> 01:00:44.444
Imagino que a coisa audaciosa é
pôr uma espécie inteira lá.
01:00:44.444 --> 01:00:48.113
Mas penso que seja perfeitamente fazível.
01:00:48.113 --> 01:00:50.173
(plateia 5) Não tentem com gatos e cães.
01:00:50.173 --> 01:00:52.457
(risos)
01:00:52.457 --> 01:00:54.622
(assistente) Penso que
o nosso tempo chegou ao fim.
01:00:54.622 --> 01:00:56.396
Muito obrigado por terem participado.
01:00:56.396 --> 01:00:59.029
Penso que os participantes
ainda estarão disponíveis para questões
01:00:59.029 --> 01:01:00.217
e para uma pausa.
01:01:00.217 --> 01:01:02.202
- Divirtam-se.
- Muito obrigado.
01:01:02.202 --> 01:01:05.032
(aplausos)