Return to Video

cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4

  • 0:06 - 0:08
    Olá a todos.
  • 0:08 - 0:12
    É espantoso ter-vos a todos aqui
    e serem tantos.
  • 0:12 - 0:13
    É mesmo, mesmo ótimo.
  • 0:15 - 0:20
    Então, a Lea já falou muito
    sobre este evento.
  • 0:20 - 0:23
    Eu vou falar um pouco
    sobre a Wikidata propriamente dita
  • 0:23 - 0:26
    e o que lhe tem estado a acontecer
    durante o último ano
  • 0:26 - 0:28
    e para onde estamos a ir.
  • 0:29 - 0:33
    Então... o que é isto? Desculpem.
  • 0:40 - 0:44
    Então... onde estamos?
    Para onde estamos a ir?
  • 0:45 - 0:50
    Ao longo do último ano
    houve muito para celebrar
  • 0:50 - 0:52
    e queria salientar algumas dessas coisas
  • 0:52 - 0:55
    porque às vezes passam despercebidas.
  • 0:57 - 1:04
    E, em primeiro lugar, quero rever convosco
    algumas estatísticas de editores,
  • 1:04 - 1:07
    o nosso conteúdo
    e como os nossos dados são usados.
  • 1:10 - 1:15
    Ao longo do último ano
    a nossa comunidade cresceu
  • 1:15 - 1:17
    o que é espantoso.
  • 1:17 - 1:21
    Temos, aproximadamente, 3000 pessoas novas
  • 1:21 - 1:26
    que editam uma vez ou mais a cada 30 dias.
  • 1:26 - 1:30
    Portanto, isso são mais de
    3000 Wikidatans novos!
  • 1:30 - 1:32
    (risos)
  • 1:32 - 1:37
    Agora, se olharem para os que fazem mais,
    por exemplo cinco edições a cada 30 dias,
  • 1:37 - 1:41
    temos mais aproximadamente 1 200.
  • 1:41 - 1:44
    E se olharem para as pessoas
    que fazem 100 edições ou mais--
  • 1:44 - 1:47
    espero que muitos dos que aqui estão--
  • 1:47 - 1:49
    temos mais 300.
  • 1:49 - 1:51
    Levantem a mão se estiverem neste grupo.
  • 1:53 - 1:56
    Vocês são demais!
  • 1:58 - 2:01
    E enquanto...
  • 2:01 - 2:06
    o número de edições
    não é algo a que normalmente
  • 2:06 - 2:09
    prestemos muita atenção,
  • 2:09 - 2:13
    nós acabamos por ultrapassar a marca
    dos mil milhões de edições este ano.
  • 2:13 - 2:19
    (aplausos)
  • 2:21 - 2:23
    Vamos, então, olhar para o conteúdo.
  • 2:28 - 2:31
    Então, estamos agora
    com 65 milhões de items,
  • 2:31 - 2:34
    portanto, entidades para descrever o mundo
  • 2:34 - 2:41
    e estamos a fazê-lo com, aproximadamente,
    6 700 propriedades.
  • 2:44 - 2:48
    Dessas, à volta de 4 300
    são identificadores externos,
  • 2:48 - 2:53
    o que nos dá muitas ligações
    a outros catálogos, bases de dados,
  • 2:53 - 2:56
    websites e mais
  • 2:56 - 2:59
    e realmente fazem da Wikidata
    um lugar central
  • 2:59 - 3:02
    numa rede aberta ligada de dados.
  • 3:02 - 3:07
    Então, usando essas propriedades e items,
  • 3:07 - 3:12
    temos agora perto de
    800 milhões de declarações
  • 3:12 - 3:16
    e comparado com o ano passado,
    sabemos mais meia declaração
  • 3:16 - 3:18
    acerca de cada um dos items.
  • 3:18 - 3:20
    (risos)
  • 3:23 - 3:25
    Então, sim, a Wikidata ficou mais esperta.
  • 3:27 - 3:30
    Mas não temos apenas items
    e propriedades,
  • 3:30 - 3:34
    também temos coisas novas
    como os lexemas.
  • 3:34 - 3:40
    Temos agora 204 000 lexemas
    que descrevem palavras
  • 3:40 - 3:42
    em muitas linguagens diferentes.
  • 3:42 - 3:43
    É muito fixe.
  • 3:44 - 3:48
    Vou falar mais sobre isto
    numa outra sessão mais tarde.
  • 3:49 - 3:53
    Por último, a mais recente adição
    são esquemas de entidades
  • 3:53 - 3:59
    que nos ajudam a descobrir como modelar,
    consistentemente, modelos de dados
  • 3:59 - 4:01
    ao longo de determinadas áreas.
  • 4:02 - 4:05
    E, desses, temos aproximadamente 140.
  • 4:08 - 4:11
    Mas números não são tudo
    em relação ao conteúdo, certo--
  • 4:11 - 4:15
    quantidade de conteúdo--
    também nos importa a qualidade do mesmo.
  • 4:16 - 4:22
    E o que fizemos agora foi treinar um
    sistema de aprendizagem máquina
  • 4:22 - 4:25
    para avaliar a qualidade de qualquer item.
  • 4:26 - 4:30
    Isto está longe de ser perfeito,
    mas já vos dá uma ideia.
  • 4:30 - 4:35
    Portanto, cada item na Wikidata
    recebe um resultado entre 1 e 5.
  • 4:35 - 4:38
    Um é mesmo terrível,
    cinco é extraordinário.
  • 4:38 - 4:42
    E ele olha para coisas
    como quantas declarações tem,
  • 4:42 - 4:44
    quantos identificadores externos tem,
  • 4:44 - 4:46
    quantas referências estão lá,
  • 4:46 - 4:49
    quantas etiquetas diferentes temos
    em quantas línguas diferentes
  • 4:49 - 4:51
    e assim por diante.
  • 4:51 - 4:55
    E, depois, olhamos
    para a Wikidata ao longo do tempo
  • 4:55 - 5:00
    e, como podem ver,
    com base nestas medidas
  • 5:00 - 5:04
    fomos de verdadeiramente terríveis
    a bem melhores.
  • 5:04 - 5:05
    (risos)
  • 5:06 - 5:07
    Logo, é bom.
  • 5:07 - 5:12
    Mas, o que também conseguimos ver
    é que ainda falta muito para o cinco.
  • 5:12 - 5:13
    (risos)
  • 5:14 - 5:20
    Eu não penso que seja aqui
    que chegaremos, certo?
  • 5:20 - 5:23
    Nem todos os items vão estar
    absolutamente perfeitos
  • 5:23 - 5:26
    de acordo com o que temos medido.
  • 5:26 - 5:29
    Mas estou realmente contente por ver
    que, consistentemente,
  • 5:29 - 5:32
    a qualidade dos dados está a melhorar.
  • 5:37 - 5:43
    Mas criar dados não é suficiente.
  • 5:44 - 5:47
    Queremos que isto...
    fazemos isto por uma razão.
  • 5:47 - 5:49
    Queremos que sejam usados.
  • 5:49 - 5:55
    E, agora, olhámos
    para a quantidade de artigos
  • 5:55 - 6:01
    noutros projetos da Wikmedia
    que usam dados da Wikidata
  • 6:02 - 6:07
    e olhámos para a percentagem
    de todos os artigos nesses projetos.
  • 6:07 - 6:10
    Se olharmos
    para todo o espetro da Wikimedia
  • 6:10 - 6:12
    e para todos os artigos que existem,
  • 6:12 - 6:19
    então, hoje, 56,35% de todos
    usam alguns dados da Wikidata.
  • 6:20 - 6:22
    O que eu considero muito bom,
  • 6:22 - 6:27
    mas claro que ainda há muito que andar
    para chegarmos aos 100%.
  • 6:29 - 6:34
    E depois, eu olho para quais os projetos
    que realmente estao a fazer maior uso
  • 6:34 - 6:36
    dos dados da Wikidata
  • 6:36 - 6:39
    e divido isto por versões de linguagem
    e assim por diante.
  • 6:40 - 6:45
    E, agora, o que é que pensam que
    os cinco primeiros projetos...
  • 6:46 - 6:48
    quais deles são todos?
  • 6:48 - 6:51
    A que família de projetos pertencem?
  • 6:51 - 6:53
    (algumas vozes na audiência) Commons.
  • 6:53 - 6:57
    Certo. Commons é mais ou menos geral.
  • 6:57 - 6:59
    Na verdade, estariam enganados.
  • 6:59 - 7:02
    Todos os cinco primeiros
    são da Wikivoyage.
  • 7:02 - 7:04
    (plateia) Oh!
  • 7:04 - 7:05
    (risos)
  • 7:05 - 7:08
    Portanto, sim,
    um aplauso para a Wikivoyage.
  • 7:08 - 7:14
    (aplausos)
  • 7:17 - 7:20
    Se querem saber onde os Commons estão
  • 7:20 - 7:22
    e onde estão todos os vossos projetos,
  • 7:22 - 7:24
    há um painel de controlo.
  • 7:24 - 7:26
    Venham comigo
    e vamos dar uma vista de olhos.
  • 7:28 - 7:32
    Claro, os nossos dados não são usados
    só dentro da Wikimedia.
  • 7:32 - 7:35
    Também são usados fora
    e aconteceu tanto.
  • 7:35 - 7:39
    Eu não posso mencioná-los a todos,
    mas para salientar alguns
  • 7:40 - 7:44
    que são os maiores utilizadores dos nossos
    dados: o Met, o Fundo Wellcome,
  • 7:44 - 7:46
    a Livraria do Congresso,
  • 7:46 - 7:48
    o GeneWiki e muitos muitos mais.
  • 7:48 - 7:51
    E, se assistirem a algumas apresentações
    que estão mais tarde no programa,
  • 7:51 - 7:53
    vão ouvir falar de alguns deles.
  • 7:57 - 8:00
    Certo, chega de estatísticas.
  • 8:00 - 8:02
    Vamos salientar aqui outros pontos.
  • 8:03 - 8:07
    Portanto, já falámos
    sobre a melhoria da qualidade dos dados
  • 8:07 - 8:11
    e, quando vemos a qualidade dos dados,
    há muitas dimensões
  • 8:11 - 8:16
    para onde podemos olhar
    e podemos melhorar algumas delas,
  • 8:16 - 8:19
    tal como quão fiáveis são,
  • 8:19 - 8:21
    quão confiáveis são,
  • 8:21 - 8:23
    quão referenciados estão,
  • 8:23 - 8:25
    quão consistentemente são modelados,
  • 8:26 - 8:29
    quão completos estão e assim por diante.
  • 8:31 - 8:36
    Só para escolher um...
    para a consistência por exemplo,
  • 8:36 - 8:42
    criámos a capacidade de guardar
    esquemas de entidades na Wikidata
  • 8:42 - 8:47
    para que possam descrever
    como certos domínios devem ser modelados.
  • 8:47 - 8:49
    Para que possam encontrar...
  • 8:50 - 8:54
    Podem criar um esquema de entidade,
    digamos, pintores Holandeses
  • 8:54 - 8:56
    e depois podem verificar como...
  • 8:56 - 8:59
    que items que são para pintores Holandeses
  • 8:59 - 9:02
    não têm, por exemplo,
    uma data de nascimento, mas que deviam
  • 9:02 - 9:05
    e coisas desse género.
  • 9:06 - 9:10
    E espero que muitos mais
    projetos wiki e outros
  • 9:10 - 9:13
    possam fazer melhor uso
    dos esquemas de entidades para tratarem
  • 9:13 - 9:16
    os seus dados.
    Se quiserem aprender como fazê-lo,
  • 9:16 - 9:18
    vai haver também
    uma sessão mais tarde
  • 9:18 - 9:23
    de pessoas que sabem tudo sobre isto
    e que farão disto um
  • 9:23 - 9:25
    mistério menor.
  • 9:28 - 9:29
    Muito bem.
  • 9:31 - 9:35
    Outra coisa que realmente ganhou tração
  • 9:35 - 9:38
    no último ano
    foi o ecossistema Wikibase, certo?
  • 9:38 - 9:44
    Esta ideia que nem todos os dados abertos
    devem e têm que estar
  • 9:44 - 9:47
    na Wikidata mas que, em vez disso,
    queremos ter um ecossistema vibrante
  • 9:47 - 9:51
    de diferentes lugares,
    com diferentes agentes,
  • 9:51 - 9:54
    como instituições, companhias,
  • 9:54 - 9:57
    programas de voluntariado que divulguem
    os seus dados da mesma forma
  • 9:57 - 10:00
    que a Wikidata faz
    e depois ligarmos tudo isto,
  • 10:00 - 10:03
    trocando dados entre eles,
    ligando esses dados.
  • 10:04 - 10:09
    E, ao longo do último ano,
    o interesse nisto
  • 10:09 - 10:12
    e o interesse nas instituições
    e nas pessoas que dirigem
  • 10:12 - 10:15
    as suas próprias instâncias baseadas
    em Wiki, realmente explodiu,
  • 10:15 - 10:20
    especialmente no setor das bibliotecas.
  • 10:23 - 10:26
    Há muitos testes, avaliações,
  • 10:26 - 10:29
    e para ser honesta, pioneirismo
  • 10:29 - 10:34
    a acontecer neste momento,
    quando instituições aventureiras
  • 10:34 - 10:39
    trabalham connosco para descobrir
    como a Wikibase pode funcionar
  • 10:39 - 10:42
    para as suas coleções,
    os seus catálogos e assim por diante.
  • 10:43 - 10:45
    Entre elas, a Biblioteca Nacional Alemã,
  • 10:45 - 10:46
    a Biblioteca Nacional Francesa,
  • 10:46 - 10:49
    OCLC e, claro, isso é muito entusiasmante.
  • 10:55 - 10:57
    Uma das razões porque penso isso
  • 10:57 - 11:03
    é que estamos a ajudar essas instituições
    a abrir os seus dados de uma forma que
  • 11:03 - 11:08
    não é só colocá-los num site
    onde alguém pode acessá-los
  • 11:08 - 11:12
    mas realmente a pensar sobre isto,
    no próximo passo depois disto, certo?
  • 11:12 - 11:15
    Deixar que as pessoas ajudem a manter
    os dados, melhorá-los,
  • 11:15 - 11:20
    enriquecê-los e isso é uma viragem
  • 11:20 - 11:25
    que eu espero
    que traga muitas coisas boas.
  • 11:26 - 11:28
    E a outra coisa com a qual nos ajuda
  • 11:28 - 11:31
    é que deixa os especialistas
    curarem os dados
  • 11:31 - 11:37
    no seu espaço, mantê-los em bom estado
    para que possamos implementar
  • 11:37 - 11:42
    processos de sincronização
    com a Wikidata, por exemplo.
  • 11:42 - 11:46
    Em vez de, permanentemente,
    estarmos nós a fazermos isso.
  • 11:47 - 11:50
    E, no final do dia,
    espero que tire alguma pressão
  • 11:50 - 11:54
    de cima da Wikidata, para ser aquele lugar
    onde tudo tem que ir parar.
  • 11:58 - 12:00
    Dados lexicográficos.
  • 12:02 - 12:07
    Ao longo do último ano,
    as pessoas começaram a descrever palavras,
  • 12:07 - 12:12
    na sua língua, na Wikidata
    para que se possam construir coisas
  • 12:12 - 12:15
    como ferramentas automatizadas
    de tradução.
  • 12:16 - 12:21
    E estamos num ponto
    em que, em algumas línguas,
  • 12:21 - 12:26
    estamos a começar a chegar perto
    de atingir essa massa crítica
  • 12:26 - 12:29
    que é precisa para realmente
    construir uma aplicação séria.
  • 12:30 - 12:33
    Em muitas línguas
    ainda temos um longo caminho a percorrer,
  • 12:33 - 12:35
    mas noutras
    começamos mesmo a chegar lá
  • 12:35 - 12:37
    e isso é realmente ótimo de se ver.
  • 12:39 - 12:41
    Se quiserem saber mais,
    venham à minha apresentação mais tarde.
  • 12:46 - 12:49
    E, obviamente, não podemos esquecer
  • 12:49 - 12:51
    dados estruturados nos Commons.
  • 12:51 - 12:52
    (membro da plateia assobia)
  • 12:52 - 12:54
    Sim! (risos)
  • 12:54 - 12:59
    (aplausos)
  • 12:59 - 13:02
    Os dados estruturados nos Commons
    que vimos na fundação
  • 13:02 - 13:06
    realmente juntaram...
  • 13:07 - 13:11
    tudo e tornaram possível
  • 13:11 - 13:15
    adicionar declarações a ficheiros
    nos Commons ao longo do último ano.
  • 13:15 - 13:19
    E as pessoas começaram a adicionar
    essas declarações a imagens
  • 13:19 - 13:23
    para as tornarem mais fáceis de encontrar,
    para se construirem melhores aplicações
  • 13:23 - 13:24
    com base nelas e muito mais.
  • 13:24 - 13:27
    É realmente excitante
    ver como está a crescer.
  • 13:27 - 13:30
    O que é realmente importante
  • 13:30 - 13:33
    para a comunidade Wikidata
    perceber aqui
  • 13:33 - 13:37
    é que, quando vemos "retratos"
  • 13:37 - 13:42
    ou "gato de casa" ou "sentar", "lagarto"
    ou "parede", aqui,
  • 13:42 - 13:45
    isso são ligações a items da Wikidata
    e propriedades.
  • 13:45 - 13:50
    Isso significa que quando criamos
    items e propriedades,
  • 13:50 - 13:54
    eles já não estão só a providenciar
    o vocabulário para a própria Wikidata.
  • 13:54 - 13:58
    Estão a providenciar o vocabulário
    para os Commons também.
  • 13:58 - 14:01
    E isto irá ser cada vez mais assim.
  • 14:01 - 14:03
    Portanto, temos de prestar muita atenção
  • 14:03 - 14:07
    a como a nossa ontologia,
    o nosso vocabulário
  • 14:07 - 14:10
    é na realidade usado em mais sítios
    do que tínhamos antes.
  • 14:14 - 14:20
    E o último que tenho é que começamos a
    construir pontes mais sólidas
  • 14:20 - 14:22
    para os outros projetos da Wikimedia.
  • 14:23 - 14:26
    A minha equipa e eu estamos a trabalhar
    no projeto Wikidata Bridge
  • 14:26 - 14:29
    e vocês devem mesmo
    vir à cabina da interface
  • 14:29 - 14:33
    e fazer uns teste do estado atual.
  • 14:33 - 14:36
    Teremos lá alguns editores de Wikipédia
  • 14:36 - 14:39
    a editar a Wikidata diretamente
    a partir dos seus projetos,
  • 14:39 - 14:41
    sem terem de ir à Wikidata
  • 14:41 - 14:44
    e sem terem de perceber tudo sobre ela.
  • 14:44 - 14:51
    Espero que isto remova mais uma
    das dificuldades que tornam difícil
  • 14:51 - 14:54
    que projetos da Wikimedia
    adotem mais dados da Wikidata.
  • 14:57 - 15:01
    Muito bem, agora as estratégias
    e para onde estamos a ir.
  • 15:03 - 15:07
    Desde Dezembro, a equipa da Wikidata
    na Wikimedia Alemanha
  • 15:07 - 15:12
    e pessoal da Fundação Wikimedia
    têm estado a trabalhar em estratégias,
  • 15:12 - 15:15
    papéis relacionados com a Wikidata.
  • 15:15 - 15:16
    É, basicamente, colocar no papel
  • 15:16 - 15:20
    o que muitos de nós
    andamos a falar
  • 15:20 - 15:23
    ao longo dos últimos quatro ou cinco anos.
  • 15:24 - 15:29
    E não sei se leram esses trabalhos.
  • 15:29 - 15:34
    Eles estão publicados no Meta Commons
    até ao final do mês.
  • 15:34 - 15:36
    Seria ótimo,
    se ainda não os tiverem lido,
  • 15:36 - 15:39
    que os lessem,
    deixassem os vossos comentários, etc.
  • 15:40 - 15:44
    Agora, uma muito rápida revisão
    sobre o que está lá,
  • 15:44 - 15:51
    é que pensamos sobre a Wikidata
    e a Wikibase em três partes.
  • 15:52 - 15:55
    Primeiro, a Wikidata como plataforma.
  • 15:55 - 15:57
    Podem vê-la no canto inferior.
  • 15:57 - 16:04
    Isso anda, na realidade, à volta
    da Wikidata permitir a cada pessoa
  • 16:04 - 16:06
    aceder e partilhar informação
  • 16:06 - 16:09
    independentemente da sua linguagem
    e tecnologia.
  • 16:09 - 16:14
    Fazemos isso providenciando
    dados de interesse geral sobre o mundo.
  • 16:14 - 16:18
    Então, basicamente,
    é o que vocês fazem todos os dias.
  • 16:21 - 16:25
    Em segundo, está a parte
    do ecossistema Wikibase,
  • 16:25 - 16:30
    onde a Wikibase, o software
    que suporta a Wikidata, alimenta
  • 16:30 - 16:35
    não apenas a Wikidata, mas uma vibrante
    rede de dados abertos, a espinha dorsal
  • 16:35 - 16:37
    de um conhecimento aberto, livre e grátis.
  • 16:38 - 16:43
    Em terceiro e último está a Wikidata
    para os projetos Wikimedia, no topo.
  • 16:43 - 16:47
    Onde a Wikidata está
  • 16:47 - 16:50
    para ajudar os projetos Wikimedia...
  • 16:51 - 16:54
    ajudá-los a estarem preparados
    para o futuro.
  • 16:58 - 17:03
    Concretamente, o que isso significa
    para o futuro próximo ou médio?
  • 17:04 - 17:06
    A Wikidata como plataforma.
  • 17:07 - 17:11
    Temos de ter melhor qualidade dos dados,
    portanto continuaremos a trabalhar
  • 17:11 - 17:14
    em melhores ferramentas, em melhorar
    as que temos e assim por diante.
  • 17:15 - 17:19
    Temos de tornar os nossos dados
    mais acessíveis
  • 17:19 - 17:24
    através de melhores APIs,
    parâmetros finais SPARQL mais robustos,
  • 17:24 - 17:27
    mas também coisas como modelar os dados
    com mais consistência
  • 17:27 - 17:31
    para que, na realidade, seja mais fácil
    reutilizá-los em aplicações.
  • 17:32 - 17:37
    E a última coisa
    seria estabelecer processos de feedback
  • 17:37 - 17:39
    com os nossos parceiros.
  • 17:40 - 17:44
    Ao contrário da Wikipédia, a Wikidata não
  • 17:44 - 17:46
    é o que costumo
    chamar um projeto destino, certo?
  • 17:46 - 17:49
    Alguém vai à Wikipédia e lê algo
  • 17:49 - 17:51
    enquanto, na Wikidata, o processo não é:
  • 17:51 - 17:53
    alguém vai à Wikidata e lê algo.
  • 17:53 - 17:54
    Seria ótimo,
  • 17:54 - 17:58
    mas, realisticamente,
    não é isso a Wikidata é, certo?
  • 17:58 - 18:01
    As pessoas que estão expostas
  • 18:01 - 18:03
    aos nossos dados
    não estão na Wikidata propriamente,
  • 18:03 - 18:07
    mas estão a ver o que querem através
    da Wikipédia e de outros sítios.
  • 18:08 - 18:12
    Agora, esses outros sítios
    recebem comentários sobre os dados, certo?
  • 18:12 - 18:15
    Os utilizadores dizem-lhes,
    "Isto está errado".
  • 18:17 - 18:21
    Eu gostava de ter isso
    para que pudessemos torná-lo disponível
  • 18:21 - 18:24
    às pessoas que realmente editam
    na Wikidata, ou seja vocês.
  • 18:24 - 18:27
    E descobrir como fazer isso
    de uma forma robusta,
  • 18:27 - 18:32
    sem sobrecarregar toda a gente,
    será um dos objetivos a atingir
  • 18:32 - 18:33
    durante o próximo ano.
  • 18:35 - 18:37
    Ecossistema Wikibase.
  • 18:37 - 18:41
    Ali, continuaremos a trabalhar
    com as bibliotecas,
  • 18:41 - 18:46
    mas também a olhar para as ciências,
    por exemplo, e mais ainda.
  • 18:46 - 18:52
    Vai haver uma apresentação Wikibase
    mais logo e vocês deviam todos ir
  • 18:52 - 18:53
    e ver o que já lá está
  • 18:53 - 18:56
    e o que as pessoas estão já a fazer
    com a Wikibase.
  • 18:56 - 18:57
    Vale mesmo a pena.
  • 18:58 - 19:01
    E o que é preciso lá
  • 19:01 - 19:03
    é também montar
    bons processos em torno disso.
  • 19:04 - 19:08
    Ajudar as pessoas a descobrir
    com quem falar sobre o quê,
  • 19:08 - 19:10
    onde podem encontrar ajuda,
  • 19:10 - 19:12
    todo esses tipos de coisas.
  • 19:13 - 19:17
    E, claro, facilitar
    a instalação e manutenção
  • 19:17 - 19:20
    da Wikibase, porque ainda é
    uma séria dor de cabeça.
  • 19:21 - 19:25
    E, por último, temos federação,
    que basicamente é
  • 19:25 - 19:27
    o que falamos para os Commons,
  • 19:27 - 19:31
    onde os Commons usam items e propriedades
    da Wikidata
  • 19:31 - 19:34
    mas para outras instâncias da Wikibase
  • 19:34 - 19:36
    para que eles também possam usar
    o vocabulário da Wikidata.
  • 19:38 - 19:42
    E isso, como estava a dizer anteriormente,
    aumenta outra vez
  • 19:42 - 19:48
    a necessidade de ter consciência
    de como o vocabulário é utilizado lá fora,
  • 19:48 - 19:51
    mais do que tivemos até agora.
  • 19:54 - 19:57
    E a Wikidata para projetos da Wikimedia.
  • 19:57 - 20:01
    Integração mais estreita
    através da Wikidata Bridge
  • 20:01 - 20:04
    e ajudar pessoas a editar diretamente
    a partir dos seus projetos.
  • 20:04 - 20:09
    E a outra questão em que todos precisamos
    pensar juntos,
  • 20:09 - 20:15
    é descobrir como reduzir
    as barreiras de linguagem.
  • 20:15 - 20:19
    Quanto mais a Wikidata estiver integrada
    nos projetos Wikimedia,
  • 20:19 - 20:22
    mais as pessoas terão
    necessidade de falar umas com as outras
  • 20:22 - 20:26
    acerca dos dados sem que a língua
    seja a mesma.
  • 20:26 - 20:32
    Temos de arranjar forma
    de lidar com isso.
  • 20:33 - 20:37
    Se alguém tem alguma boa ideia,
    adoraria falar convosco.
  • 20:39 - 20:41
    E, com isso,
    encerro a minha apresentação.
  • 20:42 - 20:44
    Obrigada a todos, por darem a mais pessoas
  • 20:44 - 20:46
    acesso a mais conhecimento,
    todos os dias.
  • 20:46 - 20:53
    (aplausos)
  • 20:58 - 21:00
    Temos algum tempo para questões.
  • 21:00 - 21:02
    Portanto, se alguém na plateia
    tiver alguma
  • 21:02 - 21:05
    ou mesmo os que estiverem remotamente
    a ver a transmissão: Olá mãe.
  • 21:05 - 21:08
    Podem perguntar no EtherPad
  • 21:08 - 21:11
    ou no canal do Telegram
    e faremos o nosso melhor.
  • 21:11 - 21:13
    Alguma coisa?
  • 21:16 - 21:17
    Ah.
  • 21:21 - 21:25
    (plateia 1) Olá a todos. Isto é mais
    um meme que uma questão.
  • 21:25 - 21:32
    Então, quando é que a extensão de tempo
    poderá ter também
  • 21:32 - 21:36
    horas e minutos e segundos?
  • 21:36 - 21:38
    Porque, até agora,
    a posição é apenas de data.
  • 21:38 - 21:42
    - Eu sei... não é uma pergunta minha.
    - (risos)
  • 21:42 - 21:44
    Por isso disse que era um meme.
  • 21:44 - 21:46
    É assim sempre,
  • 21:46 - 21:49
    mas vem sempre do remoto, por isso...
  • 21:50 - 21:53
    Eu não tenho uma boa resposta para isso.
  • 21:53 - 21:54
    Desculpa.
  • 21:56 - 22:02
    Mas talvez, no fundo,
    as pessoas precisem ainda mais disso
  • 22:02 - 22:08
    para descrever imagens no Commons.
    Portanto, até pode subir na longa lista
  • 22:08 - 22:11
    de coisas que precisam de ser feitas
    com mais rapidez.
  • 22:15 - 22:16
    Mais alguma questão?
  • 22:25 - 22:28
    (plateia 2) Linda, da equipa de pesquisa
    da Fundação Wikimedia.
  • 22:28 - 22:31
    Tenho uma pergunta acerca do que pensa
  • 22:31 - 22:38
    sobre patrulhamento e que poderá estar
    relacionado com a qualidade do conteúdo,
  • 22:38 - 22:40
    mas pode falar sobre isso.
  • 22:40 - 22:44
    Como vê, a médio prazo,
    os esforços de patrulhamento a mudar,
  • 22:44 - 22:46
    especialmente com o projeto Bridge,
  • 22:46 - 22:48
    o qual estou muito ansiosa
    por ir testar.
  • 22:48 - 22:50
    - Sim, obrigada.
    - Sim.
  • 22:52 - 22:57
    Portanto, como diz, com coisas
    como as que fizemos no Bridge,
  • 22:59 - 23:03
    muito mais esforço terá que ser dispensado
    em patrulhamento, penso.
  • 23:04 - 23:09
    Mas estamos agora com uma dimensão
    em que, provavelmente, não é exequível
  • 23:09 - 23:11
    fazê-lo à mão, por humanos.
  • 23:11 - 23:15
    Portanto, precisamos de um maior
    esforço em melhorias, por exemplo.
  • 23:15 - 23:18
    do ORES, o sistema de aprendizagem
    máquina, para que nos ajude com isso.
  • 23:18 - 23:25
    Para ajudar-nos a perceber que edições
    precisam de ser vistas por um humano
  • 23:25 - 23:26
    e quais são, provavelmente: "Certo,
  • 23:26 - 23:30
    são coisas normais,
    não preciso olhar para isto."
  • 23:34 - 23:39
    Atualmente, o ORES não é muito bom
    a avaliar o que...
  • 23:39 - 23:41
    se uma edição na Wikidata é boa ou não.
  • 23:41 - 23:45
    Existe, atualmente,
    uma campanha a decorrer
  • 23:45 - 23:50
    para treinar o sistema de aprendizagem
    máquina,
  • 23:51 - 23:52
    com a vossa ajuda.
  • 23:53 - 23:56
    Para lhe ensinar, basicamente,
    o que uma boa edição é
  • 23:56 - 23:57
    e o que uma má edição é.
  • 23:57 - 24:03
    Ainda não chegámos ao patamar
    de suficientes humanos o terem ensinado
  • 24:03 - 24:08
    para realmente o melhorarmos,
    mas, se tiverem uns minutinhos,
  • 24:08 - 24:11
    seria bestial que ajudassem
    a ensinar o ORES
  • 24:11 - 24:14
    a fazer melhores julgamentos
    acerca de edições na Wikidata.
  • 24:14 - 24:16
    E é relativamente simples:
    ele mostra uma edição
  • 24:16 - 24:18
    e vocês dizem: "É uma boa edição",
  • 24:18 - 24:20
    "É uma má edição" e mais nada.
  • 24:20 - 24:23
    Podem fazer isso sentados no sofá,
    à noite, em frente da TV.
  • 24:26 - 24:27
    (plateia 3) Partilhe uma ligação.
  • 24:28 - 24:31
    Iremos partilhar uma ligação
    no grupo do Telegram sim.
  • 24:32 - 24:36
    E, assim que tivermos chegado
    ao patamar de que precisamos--
  • 24:36 - 24:39
    penso que é à volta de 7 000,
    mas posso estar enganada--
  • 24:40 - 24:44
    então, podemos correr o programa de treino
    novamente e nessa altura será,
  • 24:44 - 24:48
    esperemos, consideravelmente melhor
    a julgar as edições na Wikidata.
  • 24:50 - 24:52
    E, depois, espero que mais de vocês
    possam usar isso
  • 24:52 - 24:56
    para filtrar as alterações recentes,
    por exemplo, na vossa lista
  • 24:56 - 24:58
    para edições que realmente
    precisam da vossa atenção.
  • 24:59 - 25:00
    Sim.
  • 25:03 - 25:04
    Olá.
  • 25:04 - 25:06
    [inaudível]
  • 25:07 - 25:10
    (plateia 4) Estou um pouco curiosa
    e esta é um pergunta que não é minha,
  • 25:10 - 25:13
    mas de colegas
    com quem tenho trabalhado.
  • 25:13 - 25:16
    Quantos mais parceiros
    se juntam à Wikidata
  • 25:16 - 25:20
    e começam a experimentar com consultas,
  • 25:20 - 25:23
    mais problemas temos
    com tempos esgotados nas consultas.
  • 25:23 - 25:26
    Portanto, o que
    se está a fazer sobre isso?
  • 25:28 - 25:30
    Então, algumas pessoas
    na Fundação Wikimedia
  • 25:30 - 25:34
    estão a analisar isso
    e-- pequena indiscrição--
  • 25:34 - 25:37
    estejam na sessão do presente
    de aniversário.
  • 25:37 - 25:39
    (risos)
  • 25:43 - 25:46
    (Bart) Olá, sou Bart Magnus
    do PACKED Bélgica.
  • 25:46 - 25:49
    Gostaria de saber se sabe
    em que estado estão
  • 25:49 - 25:52
    as federações, ou seja, reutilizar
    as tuas propriedades
  • 25:52 - 25:54
    na tua própria instância da Wikibase.
  • 25:54 - 25:57
    Há algo que queria mencionar
    em relação a isso?
  • 25:57 - 26:01
    Então, ao longo do último ano,
    muitas pessoas nos têm dito
  • 26:01 - 26:04
    que querem a federação, certo?
  • 26:04 - 26:07
    Mas o problema era que
    muitas pessoas tinham
  • 26:07 - 26:09
    várias ideias diferentes
    do que significava federação.
  • 26:11 - 26:14
    Algumas dessas coisas
    eram facilmente executáveis.
  • 26:14 - 26:16
    Outras eram realmente
    muito difíceis.
  • 26:17 - 26:22
    E a minha equipa e eu temos falado
    com muitas pessoas, por exemplo,
  • 26:22 - 26:27
    os parceiros com quem trabalhamos
    nas bibliotecas, para ver se concluíamos
  • 26:27 - 26:29
    precisamente o que precisavam.
  • 26:30 - 26:34
    E terminámos isso agora.
    Embora, claro, esteja disponível
  • 26:34 - 26:38
    para receber mais comentários
    se quiserem falar comigo sobre isso.
  • 26:38 - 26:41
    Estou agora numa fase
    onde confortavelmente digo:
  • 26:41 - 26:43
    "Certo, vamos começar com isto."
  • 26:45 - 26:48
    E diria que nos próximos
    dois ou três meses
  • 26:48 - 26:51
    vamos escrever
    as primeiras linhas de código.
  • 26:51 - 26:54
    Depois, se tudo correr bem,
    tê-lo-emos pronto para as pessoas
  • 26:54 - 26:57
    o testarem, diria que
    no início do próximo ano.
  • 27:00 - 27:01
    (moderador) Últimas questões.
  • 27:02 - 27:06
    (Finn) Finn Årup Nielsen de Copenhaga,
    Dinamarca.
  • 27:06 - 27:10
    Em relação à outra linguagem,
    tem havido muita discussão, digamos,
  • 27:10 - 27:14
    na comunidade WikiCite
    acerca de se devemos continuar
  • 27:14 - 27:16
    a colocar mais trabalhos científicos ali.
  • 27:16 - 27:20
    Isto está relacionado com quandos dados
    podemos nós colocar na Wikidata.
  • 27:20 - 27:23
    Tempos esgotados no Wikidata
    Query Service é uma das questões,
  • 27:23 - 27:24
    mas também a manutenção.
  • 27:24 - 27:30
    Portanto, o que pensa acerca...
  • 27:31 - 27:35
    O tamanho da Wikidata
    está a começar a ser um problema,
  • 27:35 - 27:36
    no geral?
  • 27:36 - 27:39
    Devemos parar de colocar
    dados nos lexemas?
  • 27:39 - 27:41
    Devemos parar de colocar
    dados científicos
  • 27:41 - 27:46
    na Wikidata ou temos alguma
    pesquisa sobre isto
  • 27:46 - 27:50
    ou estão a inflacionar
    os problemas técnicos?
  • 27:50 - 27:51
    Sim...
  • 27:53 - 27:57
    A Wikidata está definitivamente
    a chegar a algumas...
  • 27:59 - 28:03
    fronteiras de escalabilidade, digamos,
  • 28:04 - 28:06
    tanto técnica como socialmente.
  • 28:06 - 28:09
    E, para ambas,
    precisamos de soluções, certo?
  • 28:09 - 28:13
    Socialmente, temos por exemplo
    mais editores
  • 28:13 - 28:16
    e mudanças recentes, até ao ponto
    em que é completamente inviável
  • 28:16 - 28:20
    a um humano patrulhar isso
    porque é pura e simplesmente demais.
  • 28:21 - 28:26
    Mas também tecnicamente
    e temos tentado resolver isso também.
  • 28:26 - 28:30
    Por exemplo, re-arquiteturando
    a base de dados
  • 28:30 - 28:32
    à volta de tabelas de BD
    viradas para a visualização,
  • 28:32 - 28:35
    se é que isto vos diz algo.
  • 28:36 - 28:38
    Mas isso só nos leva até determinado ponto
  • 28:39 - 28:41
    e uma das coisas que queremos
    ver no próximo ano
  • 28:41 - 28:46
    é onde estão os outros
    pontos difíceis e o que fazer com eles
  • 28:46 - 28:48
    no aspeto técnico.
  • 28:49 - 28:51
    Portanto, esse é o quadro geral.
  • 28:51 - 28:54
    Ao mesmo tempo, fico muito hesitante
  • 28:54 - 28:58
    em dizer a alguém, "Não, não,
    não. Para de inserir dados na Wikidata."
  • 28:59 - 29:00
    (risos)
  • 29:00 - 29:02
    Isso vai um pouco contra
    o propósito da coisa.
  • 29:04 - 29:07
    Mas, por exemplo, o ecosistema Wikibase
  • 29:07 - 29:09
    é uma forma de tentar resolver
    isso
  • 29:09 - 29:14
    sem requerer nada da Wikidata.
  • 29:14 - 29:16
    Essa é a beleza de um sistema
    aberto de dados ligados.
  • 29:16 - 29:18
    Não temos de ter tudo
    no mesmo sítio.
  • 29:18 - 29:21
    Podemos ligar-nos a vários sítios.
    É espantoso.
  • 29:22 - 29:28
    Portanto, de volta à WikiCites
    em específico, sim...
  • 29:29 - 29:34
    Certo, a WikiCites em específico.
    Eu penso que precisamos
  • 29:34 - 29:36
    de olhar para isso proporcionalmente.
  • 29:36 - 29:41
    Não tenho uma percentagem exata
    de qual a quantidade
  • 29:41 - 29:44
    de items da Wikidata
    que estão à volta de tópicos da WikiCites,
  • 29:44 - 29:47
    mas é uma grande percentagem.
  • 29:47 - 29:50
    E talvez seja isso que
    precisamos de discutir...
  • 29:50 - 29:52
    Durante a pausa.
  • 29:53 - 29:55
    Muito obrigado!
  • 29:55 - 30:02
    (aplausos)
Title:
cdn.media.ccc.de/.../wikidatacon2019-3-eng-Glimpse_over_Wikidata_hd.mp4
Video Language:
English
Duration:
30:07

Portuguese subtitles

Revisions