Willkommen, bienvenue, bem-vindos.
Sempre quis dizer isto em palco.
(risos)
Isto vai ser inspirador porque este
é o painel inspirador oficial do Wikibase
da WikidataCon 2019.
O objetivo deste painel é deixar-se
inspirar por tudo aquilo que as pessoas
nos diferentes países,
nos diferentes campos
fazem com o Wikibase,
o software por trás do Wikidata.
Fiquei muito surpreendido
quando alguém me disse
"É a primeira vez que estou
a ouvir falar do Wikibase".
É o software que gere o Wikidata.
Se quiserem ordenar as coisas no mundo
como o Wikidata o faz
mas não concordam
com os itens que lá temos
porque talvez precisem
de um maior nível de detalhe
ou talvez não queiram começar
com o Q1, que é o universo,
porque, no vosso mundo
o Q1 poderia ser um livro
se fossem uma biblioteca
ou poderia ser um animal
se trabalhassem em biologia
ou uma personagem histórica
se estudassem Humanidades Digitais
mas quisessem
o mesmo sistema de ordenação.
Então, o Wikibase é o que procuram.
Nos últimos um ou dois anos,
estabelecemos contactos
com pessoas extraordinárias
que são pioneiras, percursoras,
que avaliam o Wikibase
e que fazem coisas fantásticas com ele.
Este painel vai ser muito rápido.
Todos os participantes
deste painel mereciam
uma hora para fazer a sua apresentação.
Mas o nosso programa está recheado.
Mantenham os cintos apertados
para uma viagem agitada
pelo mundo inspirador dos Wikibases.
O primeiro é um projeto
de duas organizações,
o que por si só é uma sensação.
A Bibliothéque Nationale de France,
a biblioteca nacional francesa
e Abes, que é uma autoridade
do ensino superior.
Mas creio que irão aprofundar isso
na vossa apresentação.
Gostaria de chamar ao palco
Anila Angjeli e Benjamin Bober
para os primeiros
10 minutos de inspiração.
(aplausos)
Olá a todos.
O meu nome é Benjamin Bober.
Trabalho para a Abes,
que significa
Bibliographic Higher Education Agency.
Basicamente, trabalhamos com todas
as bibliotecas universitárias da França
e gerimos o catálogo coletivo.
E também os seus ficheiros de autoridade.
Estou aqui com Anila Angjeli da BnF,
Biblioteca Nacional Francesa.
Vamos falar-vos
do nosso projeto conjunto
que trata de criar
uma nova ferramenta de produção
para dados de autoridade.
Pessoas, órgãos sociais, conceitos, etc.
Estamos há meses
a pedir ao Wikibase para fazer isto.
Irei contextualizar-vos rapidamente
porque é importante para nós,
enquanto bibliotecas...
Recentemente,
houve uma mudança tecnológica
com os dados abertos interligados
e queríamos,
enquanto agência bibliográfica,
acompanhar esta nova tendência.
Já lá vão anos desde que
fizemos testes
com dados abertos interligados.
RDF, SPARQL e por aí fora.
Mas acreditamos que agora
é uma boa altura para avançar.
É também uma boa altura
porque houve... não uma mudança,
mas uma alteração fundamental
na forma como encaramos
os dados bibliográficos.
Costumávamos ter, e ainda temos,
dados armazenados em registos.
Chamamos-lhes registos MARC
no contexto das bibliotecas.
Utilizávamos um formato
específico chamado MARC.
Mas recentemente
tem havido uma tendência
para pensar nisso de outro ponto de vista.
Ir de um mundo baseado em registos
para um mundo baseado em entidades
quando tentamos interligar
pessoas, trabalhos
e outras entidades.
Neste contexto, decidimos
lançar esta iniciativa conjunta.
Mas o nosso objetivo
vai muito além das bibliotecas.
Gostaríamos de ter connosco
outros GLAMS franceses, por exemplo,
porque achamos que o nosso projeto
também os pode ajudar.
Basicamente, o nosso projeto
chama-se Fichier National d'Entités.
Ficheiro Nacional de Entidades.
Será uma plataforma partilhada
para a criação e manutenção colaborativas
de dados de referência
sobre entidades.
Como disse, pessoas, órgãos sociais,
lugares, conceitos e trabalhos criativos.
Abrangemos várias coisas.
É um desafio porque é a primeira vez
que a BnF e a Abes colaboram a este nível.
Vou mostrar-vos rapidamente onde estamos,
de onde viemos
e onde estamos agora.
Estamos a trabalhar
neste projeto desde 2017.
Avaliámos outras iniciativas semelhantes
e chegámos à conclusão
de que havia um forte interesse
no Wikibase como a espinha dorsal da FNE.
Achámos que seria
uma boa solução para desenvolver
mas ainda tínhamos algumas dúvidas
porque temos necessidades
específicas para cumprir.
Então, decidimos passar este ano
a fazer uma demonstração de conceitos
com dados reais
do catálogo da BnF, do catálogo
de autoridade e dos nossos catálogos.
E a tentar reunir estes dados no Wikibase.
Ver como se comportavam
e como a ferramenta poderia
atender às nossas necessidades.
Recebemos ajuda
nesta demonstração de conceitos
da Maxime e do Vincent
da Inventaire.io,
que nos ajudaram a perceber melhor
o que o Wikibase nos poderia dar.
A Anila irá falar
sobre as primeiras conclusões.
Esta decisão de avançar
com os testes do Wikibase
como a infraestrutura técnica,
espinha dorsal
ou estrutura básica do nosso FNE
deveu-se ao facto de não ser trivial
passar de um sistema para outro.
E devido à iniciativa de usar o Wikibase
como a infraestrutura técnica
dos nossos dados.
Deveu-se a ambos.
Significa que passámos do clássico
sistema de informações de biblioteca
para algo diferente.
Precisávamos de testar primeiro
e ver se um conjunto de funcionalidades
que normalmente
precisamos de executar e cumprir
no nosso ambiente profissional...
Estou a falar de criar e manter,
não em publicar, que é muito diferente.
Estiveram na sessão anterior
com o Wikidata Commons,
"Estratégias de contribuição para GLAM".
Era sobre a publicação
e as suas formas de criação.
Temos de ir passo a passo.
Foi por isso que realizámos esta
experiência, esta prova de conceitos.
E, surpresa, não houve dificuldades
em obter dados de biblioteca
de acordo com uma
ontologia específica, que é...
Mencionei brevemente que separámos
dados em dois tipos diferentes de MARC,
depois definimos propriedades essenciais
para poder fundir os dados
e não houve dificuldades
do ponto de vista técnico.
Como é óbvio, tivemos a confirmação
de que o Wikibase
oferece funcionalidades integradas
que podem ser utilizadas como base
para a infraestrutura técnica do FNE.
Mas a decisão ainda não foi tomada
porque os testes ainda estão...
Digamos que os desenvolvimentos
foram concluídos.
Agora estamos na fase
de redigir as conclusões finais
e a decisão ainda não foi feita
do ponto de vista estratégico,
mas estas são as primeiras conclusões
que podemos mencionar.
E o Wikibase...
Parece-nos que o Wikibase
poderá ser uma boa solução operacional
para gerir esta iniciativa,
ou seja, em conjunto, em colaboração
criar estas entidades, estas coisas
para vos relembrar da oposição
entre coisas e strings.
Contudo, reparámos que há lacunas.
Nas necessidades específicas
das nossas instituições específicas,
existem comunidades definidas
com a sua própria cultura, práticas.
É um processo inerente às bibliotecas
e a solução oferecida pelo Wikibase,
por exemplo, a pesquisa.
Do ponto de vista profissional,
não apenas do ponto de vista
do utilizador final,
mas profissionalmente,
precisamos de índices
para assegurar a qualidade
e a curadoria dos dados
e isto é muito importante
para o profissional.
O Wikibase, com a sua Elasticsearch
e CirrusSearch não o oferece.
Mas ainda há margem para investigação.
E como são geridas as funções?
O Burocrata, o Verificador...
Não foi propriamente
o que aconteceu no nosso mundo.
Embora haja um nível
que pode ser usado,
sobre o qual podemos construir
outras funções que se adequam mais
à nossa forma de gerir os dados.
Ou diferentes limitações
relacionadas com a publicação de dados...
Está ali um erro, temos de corrigir.
A política de dados. Muito bem, obrigada.
Há coisas que precisam de ser...
É necessário construir
outros níveis e degraus sobre o Wikibase.
Uma das principais razões,
a razão por que estamos aqui convosco
é que estamos dispostos
e sentimos a necessidade
de ser parte de uma comunidade
que partilha as mesmas preocupações.
Dado o programa, todos nós sabemos
que as bibliotecas e os GLAMS
estão altamente representados
neste evento.
Então...
Acreditamos que possivelmente
dentro de umas semanas
ou no próximo ano, poderemos
comunicar de forma mais aberta
sobre a nossa decisão
de avançar com esta solução.
- Obrigada.
- Muito obrigado.
(aplausos)
Teremos pequenas apresentações primeiro
e voltaremos todos ao palco
para responder a dúvidas,
se tivermos tempo, mas...
Ouvimos algo vindo da França.
Há outro projeto. Chama-se...
Não é o Fichier National d'Ent...
(dificuldade em pronunciar o nome)
É o Gemeinsame Normdatei.
O catálogo de autoridade universal
dos países de língua alemã.
É um prazer ter bons amigos
do movimento Wikimedia aqui.
Barbara Fischer e Sarah Hartmann.
Muito obrigada pelo convite
para falar sobre o nosso projeto,
que se chama "GND meets Wikibase".
É um projeto conjunto
da Wikimedia Deutschland e do GND.
Gostaríamos de apresentar
uma breve descrição.
Como o Jens disse anteriormente,
só temos 10 minutos.
Porque escolhemos esta abordagem
para avaliar o Wikibase,
se preenche os requisitos
para gerir dados de autoridade
a nível colaborativo, diria eu.
O que nos traz aqui e qual é
a ideia de controlo de autoridade?
E GND, que significa
Gemeinsame Normdatei.
O que está por trás disso?
O que nos traz aqui,
como referi anteriormente.
Não é muito diferente
do que disseram a Anila e o Ben
há alguns segundos.
O GND é utilizado
para a descrição de recursos,
como publicações e objetos, por exemplo.
E para permitir
a recuperação precisa dos dados.
Diria que o GND fornece
entidades inequívocas e distintas
para essa recuperação.
Existem identificadores permanentes,
como bem sabem,
para identificação e referência
dessas entidades.
O catálogo de autoridade é utilizado
principalmente por bibliotecas,
nos países de língua alemã,
mas também outras instituições
do domínio da herança cultural
começam a utilizá-lo.
No total, há cerca de
60 milhões de registos
e, no Wikibase, diríamos "itens",
que se referem
a pessoas, nomes de pessoas,
organismos corporativos, por exemplo,
nomes geográficos e trabalhos.
O GND é gerido corporativamente
pelas chamadas agências GND
e, de momento,
há cerca de 1000 instituições
que são utilizadoras ativas do GND,
ou seja, estabelecem novos registos
e acrescentam
registos ou itens regularmente.
E o mais importante
é que os dados do GND
são fornecidos gratuitamente
sem direitos de autor
e todos os API e documentos
são também de código aberto.
Por falar nisso,
esse é o ponto fulcral.
Neste momento,
lançámos o desafio de abrir o GND
a outras instituições GLAM
e instituições do domínio da Ciência.
Neste momento, está muito focado
no setor das bibliotecas.
Isso significa que a ferramenta
dos bibliotecários tem de evoluir
para um instrumento
que seja usado e aceite entre setores.
Isso implica muito trabalho
a nível de organizações,
edifícios comunitários, discussões
sobre o modelo de dados atual
e problemas técnicos e infraestruturais.
Sim.
Por falar nos problemas infraestruturais,
tivemos a ideia de nos associarmos
ao Wikibase, por isso temos
basicamente os mesmos objetivos,
nomeadamente tornar os dados culturais
mais acessíveis e interoperáveis.
Como tal, agora avaliamos o software,
que originalmente foi concebido
para uma só aplicação, o Wikidata,
se fosse suficiente
para gerir dados de autoridade.
Olá da minha parte.
Estamos concentrados na avaliação
que fazemos regularmente
com a Wikimedia Deutschland.
Primeiro, se o Wikibase
cumpre os requisitos
das instituições GLAM - galerias,
bibliotecas, arquivos e museus -
de gerir colaborativamente
um catálogo de autoridade,
que é a nossa principal questão.
Também gostaríamos
de aumentar a usabilidade do Wikibase.
Como o sistema de software
que utilizamos atualmente
é um pouco complexo
e não é tão prático como gostaríamos.
E depois gostaríamos de saber
se o Wikibase facilitaria
a associação de dados
e o desenvolvimento
de uma comunidade diversificada.
Como disse a Sarah,
estamos num processo de nos abrirmos
a um leque mais amplo
de instituições GLAM
e instituições científicas.
Como é óbvio, elas trabalham
dentro das suas estruturas de software
e gostaríamos de saber
se o Wikibase facilitaria
a cooperação e colaboração connosco.
Porque fazemos isso?
É porque achamos que o Wikibase
talvez possa ser
uma zona comunitária atrativa,
ou seja... tive de o anotar.
Primeiro, como é de código aberto,
estará mais acessível
do que qualquer fonte
de software proprietário utilizado
nos setores da catalogação
das instituições GLAM.
Depois,
sentimos que a comunidade Wikibase
é uma comunidade muito dedicada
e gostaríamos de participar
nessa comunidade dedicada,
porque acreditamos
que o importante é partilhar.
O que queremos partilhar
é o nosso conhecimento e o vosso
para evitar a redundância,
não editando as mesmas informações
uma e outra vez,
mas reutilizando os dados, associando-os,
citando-os e enriquecendo-os.
Incluí aqui na imagem
uma das ferramentas
que é amplamente utilizada
no Wikidata, a Histropedia
porque achamos que se conseguirmos
introduzir os nossos dados no Wikibase
podemos conseguir partilhar
ferramentas, melhorar o código
e ser uma parte ativa
e contributiva da comunidade.
Obrigada.
Gostaria de debater isso
convosco mais tarde.
Muito obrigado.
(aplausos)
Muito obrigado.
A dada altura, perguntámo-nos:
"Será que sem querer escrevemos
um software de biblioteca?"
Porque a adoção do Wikibase
no setor das bibliotecas é avassaladora.
Mas não é só isso.
E, como é óbvio, não escrevemos
um sistema de biblioteca sem querer.
Também pode ser usado noutras áreas.
Por exemplo, na Biologia.
E David Fichtmueller irá
falar-nos sobre usar o Wikibase
como uma plataforma para a biodiversidade.
- Creio que estava a cinzento.
- Sim.
Ecrã inteiro? Muito bem.
Olá a todos.
Sou o David e trabalho no jardim botânico,
no Museu Botânico, aqui em Berlim.
Sou informático.
Temos um departamento
chamado Informática da Biodiversidade.
Em termos gerais, desenvolvemos o software
que os biólogos utilizam diariamente.
E a nível pessoal
sou contribuidor da Wikipedia
há quase 15 anos
e contribuidor do Wikidata
há quase cinco anos.
Como parte do meu trabalho,
sou também co-administrador
de uma "quinta" MediaWiki
com mais de 80 wikis
sobre a comunidade bióloga.
Há uns anos,
fui designado para um projeto
que envolvia trabalhar numa norma.
Especificamente,
uma norma chamada ABCD
que precisava de algumas melhorias.
Presumo que a maioria
não ouviu falar do ABCD,
o que não é de todo mau.
É muito específico.
Significa "Access to Biological
Collection Data".
É um esquema XML.
Expressa informações biológicas,
coisas específicas como informações
sobre folhas de herbário,
sobre coleções,
como peixes em frascos de álcool...
Mas também observações.
Cientistas em campo a observar
certas plantas, certos animais.
Uma grande variedade.
E, como tal, é uma grande norma.
Temos 1800 conceitos diferentes
lá guardados.
Tendo em conta os diferentes
XPaths existentes no catálogo.
O desafio era convertê-lo
numa nova e moderna norma semântica.
Queríamos utilizar uma ontologia OWL
que fosse capaz de expressar
o mesmo tipo de informações
que fora anteriormente expresso
nos ficheiros XML
e também manter
toda a documentação existente
restrições e associações entre os itens
e construir uma plataforma colaborativa
onde outros cientistas
pudessem contribuir e aconselhar-nos
sobre as suas áreas de estudo específicas.
"Modelámos isto bem?
Há alguma coisa em falta?"
Com tudo isto em mente,
fomos à procura
e encontrámos uma solução.
Não é surpresa para ninguém.
É o Wikibase.
Caso contrário, não estaria aqui.
Por isso, decidimos usar o Wikibase.
Começámos a instalá-lo
sem o Docker Image.
Grande erro. Não repitam.
(risos)
Em nossa defesa,
começámos isto há dois anos e meio.
E foi há dois anos, na WikidataCon,
que o Docker Image
foi lançado pela primeira vez.
Tivemos de nos desenrascar.
E assim que pusemos tudo a funcionar,
não quisemos alterar nada.
Agora, temos o Docker
instalado para o Query Service
e temos uma instalação
híbrida e personalizada,
uma instalação Docker
e scripts modificados
a ligar essas duas instâncias.
Depois, instalámos
manualmente o QuickStatements
porque naquela altura
não fazia parte do Query Service.
Fizemos algumas modificações
e ajustes para que funcionasse.
Sei que agora faz parte do Docker Image.
Mas pusemo-lo a funcionar,
não nos importamos em alterá-lo.
Já voltamos a isto.
Antes de falar sobre o que fizemos,
quero evitar uma possível confusão
porque estamos a falar
sobre normas de dados
e quando expressarmos
as coisas de forma semântica
iremos converter os conceitos
do XML em Classes e Propriedades.
Propriedades de Objetos
que ligam as diferentes classes
e Propriedades de Tipos de Dados,
que incluem o conteúdo,
ou seja, para guardar texto,
números e coisas assim.
Expressamos tudo isto no Wikibase,
mas tudo isto são itens no Wikibase.
E são descritos utilizando
propriedades do Wikibase.
Temos propriedades ABCD
como itens que são descritos
como propriedades do Wikibase.
Tento usar os prefixos em conformidade
para que saibam do que estou
a falar quando falo sobre propriedades
nesta palestra.
Olhemos para as propriedades,
em particular as Propriedades Wikibase.
Sentámo-nos e pensámos,
"O que precisamos de descrever?
Os conceitos que queremos modelar?"
E acabámos por usar
cerca de 25 propriedades
além de "etiqueta", "descrição" e "alias".
Não vou mencioná-las a todas,
vejam a variedade.
Aquelas preenchem os nossos requisitos.
Algumas expressam restrições e outras...
A maioria é opcional.
Poucas são obrigatórias.
Depois, decidimos importar
toda esta informação.
Criámos um Interpretador de Esquemas
que extrai os diferentes conceitos.
Tudo o que tem um XPath
dentro do esquema XML
e toda a documentação
que faz parte do esquema XML
e reunimo-lo num ficheiro CSV
e depois pudemos trabalhar nele
e importá-lo utilizando o QuickStatements.
Funcionou bem.
Mas tínhamos mais de 1800 conceitos
na nossa instância do Wikibase.
Quando tínhamos coisas
como nomes de pessoas,
e-mails de contacto...
Apareceram algumas vezes
dentro do esquema.
Proprietários de dados,
autores de imagens, coisas do género.
Obviamente, tivemos de reduzir isso
e combiná-lo em classes reutilizáveis.
Houve muita edição manual
para reduzir o número de conceitos
e, no final,
acabámos com pouco mais de 500.
Temos Classes, Propriedades de Objetos,
Propriedades de Dados,
alguns que vou ignorar
para evitar a complexidade.
Para grandes edições,
também usámos o QuickStatements.
Fizemos as edições e queríamos garantir
que os dados que tínhamos
eram consistentes.
Foi então que usámos
as Consultas de Manutenção.
Usámos a interface de consulta
com algumas consultas SPARQL
para verificar propriedades em falta,
associações incorretas entre conceitos,
coisas que não correspondiam
ao nosso conceito, à nossa estrutura.
No final, também tivemos de fazer
uma revisão manual de todos os conceitos
para garantir que não escapou nada.
Deu muito trabalho
porque se tirarmos
cinco minutos para cada item
e os multiplicarmos por 550
dá mais de uma semana
de trabalho intenso.
Mas como é óbvio
não precisamos de cinco minutos,
porque passamos meia hora
a corrigir um determinado item
quando há problemas com a modelação.
Agora, tínhamos todos os dados.
Era altura de os exportar do Wikibase.
Criámos um script de exportação
no Python que usa o Query Service
para obter informações sobre os conceitos
e inseri-las em templates preparados.
No final, obtivemos um ficheiro OWL válido
que contém tudo o que precisamos.
Esta é a base da norma.
Em futuras versões,
quando fizermos revisões,
o Wikibase será
a nossa platafo \rma de trabalho.
Assim que fizermos uma exportação,
esta será a nova versão da norma.
Mantê-las separadas
também nos irá permitir
transferir o servidor para outra instância
ou, como disse, mudar a instalação.
Exportamos JSON
para a documentação do site.
E também exportamos os dados
para uma segunda instância do Wikibase.
Para já, isto é muito experimental.
Ainda não o usámos em produção.
Os conceitos podem ser utilizados
para descrever dados reais.
Estamos a decompor esses...
Estamos a abandonar a ideia
de que as propriedades são itens Wikibase
e a convertê-las
em verdadeiras propriedades Wikibase.
São muitos requisitos, muitos passos,
para manter todos os dados
e associações consistentes,
mas funciona.
No final, foi um sucesso.
Há uma grande comunidade...
Há uma comunidade,
a Biodiversity Information Standards,
que também teve
o seu encontro anual nos últimos dias.
Há um grande interesse
em reutilizar esta abordagem
para outras normas.
No futuro, queremos
fazer testes com Shape Expressions.
Como disse,
temos algumas restrições para as exportar
e construir melhores fluxos de trabalho
para controlo de versão.
Ainda não o fizemos.
E substituir a instância do Docker.
No final, terei uma pequena lista
de coisas que poderiam ser melhoradas.
Há muito mais ferramentas
que foram criadas para o Wikidata,
mas que podem ser mais agnósticas.
Em particular, o QuickStatements.
Como disse,
fiz alguns ajustes manualmente.
Muitos dos problemas
que tive já terão sido resolvidos,
mas não todos.
Queremos importar os modelos existentes
ou o modelo SPARQL, os modelos Q e P.
São muito úteis
ao trabalhar com o Wikibase.
Isto seria feito automaticamente.
E, como disse,
fizemos muitas edições manuais.
Seria útil e ideal
se tivéssemos uma ferramenta
como uma tabela de Excel.
Carregamos alguns itens
e algumas propriedades
e saltamos de célula em célula.
Editamos muita coisa muito rapidamente
de forma semiautomática.
Obrigado. Chegámos ao fim.
Muito obrigado.
(aplausos)
Há muito a dizer.
Há não só... Como saio daqui?
Não se trata apenas
de ciência nem de bibliotecas.
Também podemos criar
arte e beleza com o Wikibase.
E quem melhor para nos falar
sobre isto do que Stuart Prior?
É embaraçoso falar de arte e beleza
e ter uma apresentação tão feia.
(risos)
A começar por uma sala
cheia de Wikimedians...
Comboios, as pessoas gostam de comboios.
Mas tem um objetivo.
Esta é a Hackney Downs Station
no nordeste de Londres.
Está relacionada
com a Banner Repeater e o Wikibase.
Explicarei adiante.
Esta é uma fotografia terrível.
Mas é onde está um arquivo
de publicações de artista,
que é na plataforma
de uma estação de comboios.
Ali, têm centenas de cópias
de vários tipos de publicações de artista.
Há muito movimento.
Há muita proximidade com o público.
Entramos no comboio
e deparamo-nos com obras de arte obscura.
É um projeto muito interessante
mas faz parte
de uma comunidade mais ampla.
O que são publicações e livros de artista?
Eu também não sabia.
A definição, de acordo com a Wikipedia,
é "livros de artista são obras de arte
realizadas sob a forma de um livro".
Podem ler.
Mas são obras de arte individuais
ou coleções de arte
que utilizam a publicação como meio.
Isto varia bastante, é muito interessante.
Era tipo...
Via-se muito no início dos anos 20 e 30
e voltou a surgir nos anos 60 e 70
e continua a expandir-se.
Tem uma grande comunidade global,
multilingue,
algo distinta
das grandes instituições artísticas.
Encontrarão coleções.
A V&A tem uma coleção, como é óbvio.
Têm vários itens como este.
Isto é apenas um artigo,
não é o melhor exemplo.
Mas é uma área interessante,
embora de nicho.
Mas não é muito boa no Wikidata.
Esta é outra fotografia terrível,
não é minha.
São algumas das coisas
guardadas no arquivo da Banner Repeater.
Ali no meio, o cor-de-rosa, Blast,
é uma publicação de autor
bastante notável dos anos 20.
Qual o aspeto no Wikidata?
Não é bom.
É frequentemente confundido com livros
ou outras formas de publicação.
O típico item do Wikidata
para uma publicação de artista notável
não tem muito a dizer sobre ela.
É apenas... aqui têm.
Não há muitos números identificadores.
Há muita coisa em falta
no que diz respeito
às publicações de artista
em comparação
com formas de arte mais tradicionais.
Pinturas, esculturas, etc.
E há um grande desejo na comunidade
de começar a codificar isto
e a torná-lo real.
Vou dar-vos um exemplo
do que realmente está disponível.
Podem indicar o que
está errado com esta consulta.
Isto é tudo o que há.
São todos os livros de artista
no Wikidata.
Não é muita coisa.
Alguns nem etiquetas têm.
É algo que precisa de ser explorado.
E que tem capacidade para tal.
Já alguém percebeu
o que há de errado com esta consulta?
As etiquetas dizem "salsicha"
porque roubei a consulta de outra pessoa
e alterei o número-chave.
(risos)
Na verdade,
é uma consulta sobre salsichas.
Avançando.
Estão a ver que não tem grande presença.
Fomos abordados pela Banner Repeater.
Trabalho para a Wikimedia UK.
Fomos abordados pela Banner Repeater
para os ajudar
com a configuração do Wikibase.
Em termos de financiamento adicional,
mas também em termos de atrair
uma comunidade mais ampla
e de participar no processo.
O processo consiste basicamente
em reunir esta comunidade
de artistas, arquivistas
e especialistas de dados interligados
e perceber qual deveria ser
o esquema, o modelo de dados
para as publicações de artista.
É um campo muito especializado.
Não se enquadra muito no Wikidata.
Provavelmente, é demasiado detalhado.
E outro aspeto é a flexibilidade.
Talvez não se adeque ao Wikidata.
Talvez seja demasiado rígida de momento.
O Wikibase está em fase de construção,
por isso não tenho muito para
vos mostrar. Ainda não foi construído.
Isto tem mais a ver com o processo.
O processo é a consulta extensiva
da comunidade, de alguns níveis.
Não vamos fazer isto em apenas uma sessão.
A decisão não é só de alguns.
É um processo contínuo.
O impacto disto
pode ser muito substancial
porque mais ninguém
está a fazer este trabalho.
Muitas das instituições de maior dimensão
têm publicações de artista esquecidas.
Não sabem como as categorizar.
Não as categorizaram bem.
Não têm grande interesse nisso.
Mas há uma grande comunidade que tem.
Basicamente, este é o processo atual.
O workshop inicial já foi realizado.
Foi um workshop especializado
com pessoas
profundamente ligadas
às publicações de artista.
Arquivistas, colecionistas, etc.
Para estabelecer prioridades básicas
e analisar o que de facto existia.
Qual o estado no Wikidata
e como poderia ser expandido ou melhorado.
Depois, documentaram isso
e estabeleceram esta estrutura básica.
Agora, avançámos para o próximo passo,
que é alcançar uma comunidade mais ampla.
Não só titulares de dados,
mas criadores também.
Haverá muita narrativa
e muitos aspetos qualitativos.
Coisas que não pertencem ao Wikidata.
Mas também trabalhar com arquivistas,
especialistas de dados interligados, etc.
para juntar tudo isto.
Para criar um recurso
que tenha um front-end acessível
e construir uma comunidade
que possa contribuir para isso
e deter este conjunto de dados.
Vou mostrar-vos o que já temos.
Isto está sujeito a alterações.
Mas é basicamente
o que obtivemos com os especialistas.
Diferentes "números P"
e o seu equivalente no Wikidata.
E, obviamente, é muito mais detalhado
do que as informações
no Wikidata, de momento.
Há muitos detalhes e qualidades,
como altura, largura, espessura, etc.,
que não estão tão presentes
noutros grupos
de publicações de artista no Wikidata.
Mas também há outras coisas
como "autor do pedido" e "colaboradores".
Muitos destes trabalhos
terão vários colaboradores.
E várias edições.
Há muita informação detalhada
que se pode referir.
E muita narrativa também.
À medida que as coisas
se alteram e são reinterpretadas.
E foi isto que criámos.
Mais uma vez, a maioria
tem equivalentes no Wikidata
mas alguns ainda não.
O que temos aqui?
Outras edições e coisas assim.
É bastante especializado.
Esta é a primeira fase.
Vai passar por outro processo
à medida que as pessoas
retiram coisas ou contribuem.
A flexibilidade é muito importante.
Trata-se de fugir às normas antigas
e passar para algo mais atualizado
e algo onde a comunidade
possa fazer a diferença
sem que isso lhe seja imposto.
Vou falar mais rápido.
A dinâmica de poder atual
e porquê o Wikibase.
Atualmente, este é o mundo das artes.
Uma coisa grande e laranja.
Temos as grandes instituições
e temos grupos de publicações de artista.
Pode ser Deli,
Cidade do México, Londres, etc.
O que não queremos é esta situação
onde as grandes instituições
e os especialistas impõem
o tipo de ontologia
e a forma como as coisas vão funcionar.
Trabalhar para estabelecer um Wikibase
entre uma comunidade de artistas
pode ajudá-los
a perceber o que vão fazer.
E depois começam a empurrar
para as instituições maiores
com um modelo de dados mais flexível,
algo mais atual
e típico de organizações base
em vez de instituições, por assim dizer.
Creio que há
um enorme valor nesta abordagem
em termos de criar
uma espécie de infraestrutura paralela
para comunidades de pessoas
que detêm conteúdo e assim.
Muito à semelhança do Wikimedia.
E expandir para as instituições
em vez do contrário.
Tenho mais um diapositivo?
O que se segue?
Incluo sempre este
porque é o pior e é um estereótipo.
O que se segue? Vamos avançar
para a fase de consulta da comunidade.
Tornar-nos-emos
mais expansivos e interessantes.
Obviamente, esta base de dados
irá dialogar com o Wikidata,
mas ainda não sabemos em que termos.
Mas poderá tornar-se
uma instância muito específica
de publicações de artista
que o Wikidata
poderá usar e vice-versa.
Vou terminar com esta fotografia
porque gosto dela.
Está tudo dito. Obrigado.
Muito obrigado.
(aplausos)
Estamos quase no final
da nossa agitada viagem e...
O que dizer?
Guardamos o melhor para o fim?
Não, mas deixámos a última apresentação
para alguém que é um verdadeiro
pioneiro na utilização do Wikibase
na área das Humanidades Digitais.
Sim, Olaf Simons.
Não tens uma apresentação,
mas vais improvisar.
Exato.
Faço parte da Wikipedia desde 2004.
Faz agora 15 anos.
O que vou mostrar-vos?
Já me felicitaram por isto.
Vou mostrar-vos a instância
do Wikibase que criámos.
Não é um Docker Image.
Concordo que ter um Docker
não é a melhor opção.
Ter uma instalação independente
não é o melhor.
É difícil. E tem sido
extremamente difícil para nós.
Estamos gratos à Wikimedia Germany
por nos ajudar a cumprir
o nosso acordo mútuo.
Basicamente, temos aqui vários projetos.
É mais orientado para projetos
do que o Wikidata.
As minhas coisas deverão estar aqui.
Abro isto e vou... Já o devia ter feito.
Aqui temos.
A história dos Illuminati.
Vou começar por este.
É um pequeno vídeo
que foi criado por Paul-Olivier Dehaye,
que apenas conheço do Twitter
quando nos perguntou
que tipo de testes fizemos
quando obtivemos o nosso Wikibase.
Ele estava a fazer os seus.
Falei com ele
sobre as coisas que podíamos fazer
e as coisas que não podíamos.
Isto era um vídeo
que eu queria muito fazer.
E ele disse, "Isso é simples.
"Posso fazer uma pesquisa SPARQL,
obter as informações
e reuni-las num programa
onde poderás vê-las."
São 20 anos de investigação
sobre os Illuminati
e oferece uma pequena história
sobre toda a organização
e todas as suas correspondências.
Não é uma ferramenta Wikimedia.
Não é uma ferramenta do Wikibase.
Mas é algo que podem fazer.
E, na verdade, eu gosto
que ainda não seja uma ferramenta.
Deverá tornar-se uma.
Gosto dela porque mostra
que os nossos dados são realmente grátis.
Alguém pode transferir
os nossos dados, fazer algo com eles
que não esperávamos
e pode ser feito numa questão de horas
se forem inteligentes.
E ele é, claramente.
Então, ele criou isto para nós.
Voltando à minha apresentação.
Porquê no Wikibase?
Esta foi a primeira pergunta
quando abordámos a Wikimedia.
Já conhecia o Wikidata desde 2010.
E, em 2017, estava pronto
para ser utilizado por nós.
E havia um interesse do pessoal
da Wikimedia em dizer,
"Façam-no, nós apoiamo-vos."
Porquê a nossa própria base?
Basicamente, devido à investigação
original que temos de conduzir.
E toda a instalação
é uma ferramenta de pesquisa.
Não serve só para vermos o que fizemos
e para efeitos de apresentação.
Eu uso-a todos os dias
para a minha investigação.
Altero datas de documentos
e vejo como as coisas ficam quando o faço.
Trabalho muito com hipóteses.
Pedimos aos projetos que têm dados
que nos forneçam os seus dados,
que os introduzam no sistema
e que lhes atribuam uma etiqueta,
um item aos seus conjuntos de dados.
Isto foi produzido
pelo projeto que se segue.
Os próximos projetos podem continuar.
Mas já lá está o marcador
de que este é um conjunto de dados
com trabalho de um determinado projeto.
Se tiverem um projeto, DFG...
...financiado pelo DFG,
o instituto de investigação alemão,
se tiverem um projeto
cujo trabalho queiram apresentar,
podem fazer uma pesquisa SPARQL
e apresentar todo o grupo
de conjuntos de dados
no resumo final do vosso trabalho.
Obtemos estudos originais,
identificamo-los
e encorajamos a hipótese de trabalho.
Esta é uma ferramenta de trabalho.
E é bastante útil para começar do ínicio,
não para apresentar algo do final
mas desde o primeiro dia.
Podem colocar no Wikibase
o que acreditam
ser a resposta correta a essa pergunta
e fundamentar informações
até verificarem que esta
é a identificação certa de uma pessoa
ou a data certa de algo
que ainda não conseguimos datar.
Acumulem trabalho enquanto o fazem.
Usem o Wikibase
como uma espécie de ferramenta
que vos aproxima do resultado final.
O nosso primeiro encontro
foi a 1 de dezembro de 2017.
E lembro-me que tinha
um pequeno desafio para vocês
que era a data de um óbito,
o óbito de uma pessoa.
Queria que alguém me mostrasse a fonte
e foi extremamente difícil
porque era preciso criar a fonte
antes de a poder associar.
Na sala, tínhamos a noção clara
de que se fizéssemos isto
fá-lo-íamos com as fontes que já faziam
parte da nossa instalação Wikibase.
E se tivéssemos lá as fontes,
ou seja, todos os livros
modernos que foram impressos,
seria o ideal.
Se os tivéssemos lá,
precisávamos do GND.
E quando soubemos que o pessoal do GND
estava em vias de testar o software
abordei-os e perguntei, "Não gostariam
de fazer isto em colaboração connosco?
Para podermos ter acesso aos vossos dados,
que queremos ter de qualquer maneira
e para que possam ver
como funcionam num Wikibase".
E é aqui que nos encontramos.
De momento, diria que não sabemos
como fazer uma série de coisas
ou eu pelo menos não sei.
Como fazer o input.
Como passar de um recurso de strings
para um recurso baseado em itens,
muita coisa.
E, basicamente,
a minha palestra é um convite.
Juntem-se a nós.
Ainda não fazemos parte
da comunidade Wikibase.
Isso não existe.
Temos uma comunidade Wikidata.
Está a acontecer muita coisa no Wikidata,
mas pedir ajuda para um Wikibase
que não é um Wikidata é difícil.
Primeiro, gostaria de dizer
que trabalhar connosco é fixe
porque podem usar os dados do Wikidata
a qualquer momento sem direitos de autor.
Podem usá-los
como incubadoras do vosso trabalho
e trazê-los para o Wikidata.
Além disso, vamos trabalhar com grandes
volumes de dados, quando tivermos o GND.
Vai ser muito interessante.
Se querem mesmo o desafio,
podem fazê-lo na nossa plataforma.
E oferecemos comunidades interessantes.
Basicamente, uma das coisas que difere
é que todos temos contas
e instituições honestas.
Isso também significa
que podem fazer coisas
que não poderiam fazer no Wikidata.
Podem fazer
a vossa genealogia no nosso site.
Não nos importamos. É interessante
ver pessoas a obter esses dados.
Podem fazer
a investigação histórica da vossa cidade
na nossa plataforma, não nos importamos.
Podem fazer investigação
na nossa plataforma.
É preciso fazer muita coisa.
Temos imensos problemas
em gerir a base de dados.
Foi implementada pelo Wikimedia,
mas agora vemos
que muita coisa não funciona.
Não conseguimos corrigir isso.
É muito difícil arranjar ajuda
para gerir a base de dados,
para a atulizar
para resolver pequenos problemas técnicos
que enfrentamos assim que executamos
uma instância fora do Wikidata.
É difícil obter o link direto do GND.
Funciona no Wikidata,
mas não na nossa instância.
Exportar imagens do Wikimedia Commons
para o nosso Wikibase
não é assim tão fácil.
Ainda há muito por resolver.
Por isso, isto é um convite.
Se quiserem juntar-se a nós, façam-no.
Falem connosco.
Se quiserem ajudar-nos
com aspetos técnicos,
são muito bem-vindos.
E depois precisamos de ferramentas.
Viram a ferramenta que tínhamos no início.
Na verdade, não é assim
tão difícil obter essas ferramentas.
Vi o tipo de consulta
que fazem para obter essa visualização
e, assim que a têm,
deverão conseguir modificá-la facilmente.
Estas ferramentas
são extremamente importantes
na nossa comunidade
de projetos de Humanidades Digitais.
Há poucas empresas
que criam estas ferramentas
uma e outra vez e obtêm lucro com isso.
Eu adoraria ter estas ferramentas
gratuitamente de uma vez por todas.
No mercado e a trabalhar
com uma instância do Wikibase.
Quem tiver interesse em desenvolver
ferramentas que fale connosco.
Temos muitas ideias
do que os historiadores de visualização
gostariam de ver e devemos fazê-lo.
Basicamente, ainda há muito por fazer.
Tenho um minuto. Não preciso de um minuto.
Estão a pôr-me sob pressão.
(pessoa) Dê-o ao público.
- Dou um minuto ao público.
- Muito obrigado.
Talvez te queiras sentar.
Gostaria de voltar
a chamar toda a gente ao palco.
Podemos ter uma sessão de perguntas.
Gostei muito que tivéssemos
terminado com um convite
porque é disso mesmo que se trata.
Estão convidados a fazer perguntas.
Também estão convidados a juntarem-se
a nós amanhã no encontro do Wikibase.
Se tiverem alguma ideia
para uma excelente instalação Wikibase
para a vossa instituição,
passatempo ou para mudar o mundo
juntem-se a nós, iremos reunir-nos e...
Há aqui um problema com as cadeiras.
Ficamos de pé. Muito bem.
Acho que temos aqui outro microfone.
(pessoa) Eu tenho
o microfone para as perguntas.
Muito bem.
Obrigado aos oradores.
Venham ter connosco
ao encontro do Wikibase.
Agora, mal posso esperar
para ouvir as vossas perguntas.
(pessoa) Quem é o primeiro?
(pessoa) Olá. Também sou oradora
na sessão de esclarecimento
sobre geociência e sobre como
há muitos repositórios de dados
em giociências que recolheram
e partilharam dados com a comunidade
durante anos
e até décadas em alguns casos.
Eles fazem a curadoria do conjunto
de dados, melhoram os esquemas
obtêm muito feedback da comunidade.
Tudo o que mais querem
é organizar a comunidade
para permitir
o crescimento destes repositórios.
Não querem necessariamente
colocar todo o seu conteúdo no Wikidata
e perder o controlo sobre ele.
Oferecem um excelente serviço
de curadoria deste conteúdo.
Então, só queria salientar
que alguns dos requisitos
e necessidades
que foram referidos pelos oradores
estão presentes nas minhas comunidades.
A minha questão é
como misturam ou mantêm o controlo
sobre esses esquemas, sobre as normas
ao mesmo tempo que permitem
que a comunidade introduza feedback
e tenha mais deste espírito
de crowdsourcing do Wikidata?
Todos podem responder,
mas talvez queiras começar, David?
Não sei se serei a pessoa certa para
responder a isto porque no nosso caso...
Em termos de modelação de dados,
somos muito poucas pessoas
a fazer o trabalho.
Contactamos especialistas
para os segmentos relevantes
e alguns deles podem contribuir,
mas no caso atual
só eu e dois colegas
é que trabalhámos nisso.
Queremos ter esta opção
de chamar especialistas,
mas sempre
em estreita colaboração connosco
para que não nos preocupemos
com o problema do crowdsourcing.
Como membro da comunidade Wikimedia,
não me preocuparia tanto.
95% das edições são boas
e introduzem melhorias. Mais de 95%.
Assim que temos
uma instância que está fechada,
onde ofereço as contas com nomes reais,
é um impedimento adicional
que ninguém é louco para contornar.
Na nossa instância, as pessoas
são obrigadas a fornecer um endereço.
Na página. Não a mim, mas na página.
E isto é algo que normalmente
só as instituições fazem.
Ou entidades privadas.
"Sou uma entidade privada.
Adoro este estudo.
Esta é a minha área.
Dou-vos o meu endereço."
E isso é algo que desencoraja
qualquer vândalo
que queira destruir o Wikidata.
Podemos encerrar o sistema
mas assim não faríamos parte
da mesma comunidade evolutiva.
Mas repito,
se abdicarem dos direitos de autor,
podem abrir-se, ser a incubadora
onde as pessoas fazem as pesquisas
e as disponibilizam à comunidade.
Mas é um convite.
Usem trabalhos fechados
e uma instância onde trabalhem
com pessoas que admiram.
Eu creio que...
Não creio que seja apenas a minha opinião.
Há diferentes perspetivas.
E é difícil conciliar
todas as perspetivas e dizer,
"O Wikidata é a solução
para todo o mundo".
Com isto, não quero dizer
que o Wikidata não é uma solução
mas há diferentes perspetivas
e necessidades.
O mundo é...
Há uma grande variedade de necessidades,
de perspetivas profissionais
que não é possível conciliar
numa única base de dados universal.
Por isso, creio que ambos...
O mais desafiador é como conciliar
e encontrar formas de diálogo
entre estas duas grandes famílias
de necessidades e perspetivas.
Se houver mais perguntas,
preferia responder a outras.
Mais alguém?
Se não, enquanto
pensam nas vossas perguntas
gostaria de dizer
que essa é uma das razões
por que considerámos o Wikibase.
Acreditamos que adicionar,
editar informações
na instância do Wikibase, onde temos
direitos e funções como no Wikidata
nos dá a oportunidade
de partilhar essas informações
com as informações no Wikidata
de forma mais fácil e conveniente
do que se tentarmos estabelecer
ligações entre o catálogo de autoridade
e o Wikidata, neste momento.
(pessoa) É muito interessante
saber como estão
a "energizar" as comunidades
para encontrar as suas próprias
formas de modelação de dados
e introduzi-las no Wikibase.
Em relação à comunidade do Stuart Prior,
mas também algumas das outras,
tentarão integrar as abordagens
que, enquanto comunidade,
acharem que funcionam
de volta no Wikidata e dizer:
"Fizemos livros de artista,
vasculhámos em várias iterações
"e descobrimos o que realmente funciona
e as propriedades que deverão ter
"ou revisões que deverão fazer
ao modelo de dados do Wikidata".
Boa pergunta. Uma resposta curtinha.
É uma pergunta interessante.
Não sei se isto é um modelo
que irá funcionar com outros tipos.
Espero que sim.
Mas é difícil saber
se a comunidade Wikidata
aceita o tipo de autoridade
de uma comunidade separada
que se distancia e faz o trabalho por si.
Mas espero que seja uma forma de as
pessoas contribuírem para este processo
sem terem de ir ao Wikidata para o fazer.
Eu diria, levem.
Levem se for conveniente e vejam
como funciona nas outras instâncias.
E se sentirem que é uma boa propriedade
para fazer determinadas pesquisas,
então será adotada, irá circular.
Não vejo as autoridades a fazer isso.
(pessoa) Como utilizador do Wikidata,
o que é fantástico
é que estabeleceram um código
que funciona e é executável.
Estabeleceram um modelo de dados
que as pessoas conseguem ver.
É implementável e funciona.
Então, na comunidade do código aberto,
mostrem-nos o código.
Podem fazer isso.
É por isso que acho
tão entusiasmante ter estas ramificações
que podem sustentar
a modelação de dados.
Sim, obrigado. A questão é mesmo essa.
Também gostei
do verbo que usou, "energizar".
É isso mesmo que queremos fazer.
Energizar, como no Star Trek.
Este painel chegou ao fim.
Se tiverem mais questões
sobre estes projetos Wikibase, falem.
- Venham amanhã.
- Conversem.
É esse o objetivo desta conferência.
Muito obrigado.
(aplausos)