1 00:00:06,254 --> 00:00:08,249 Boa tarde a todos. 2 00:00:08,929 --> 00:00:12,068 Bem vindos ao nosso painel GLAM. 3 00:00:13,124 --> 00:00:17,009 Antes de começarmos, tenho dois anúncios a fazer. 4 00:00:17,329 --> 00:00:23,049 Em primeiro lugar, usem exaustivamente o Etherpad para tirar notas, por favor. 5 00:00:23,781 --> 00:00:27,998 O segundo é direcionado para a nossa audiência em casa, 6 00:00:27,998 --> 00:00:29,819 ou onde quer que estejam. 7 00:00:29,819 --> 00:00:30,958 Se tiverem alguma questão, 8 00:00:30,958 --> 00:00:34,028 podem sempre escrever no Etherpad, 9 00:00:34,028 --> 00:00:37,828 e os nossos anjos na sala darão seguimento. 10 00:00:39,328 --> 00:00:44,348 Decidimos que, para o painel deste ano, 11 00:00:45,388 --> 00:00:48,868 depois de ver todas as contribuições que foram fazendo, 12 00:00:49,128 --> 00:00:52,118 que deveríamos focar-nos no papel de Wikidata 13 00:00:52,129 --> 00:00:54,297 dentro dos ecossistemas de dados 14 00:00:54,297 --> 00:00:57,199 para ir além dos projetos de Wikimedia atuais. 15 00:00:57,199 --> 00:00:59,987 O que está perfeitamente alinhado 16 00:00:59,987 --> 00:01:03,732 com a estratégia da nova Fundação Wikimedia. 17 00:01:04,652 --> 00:01:07,947 E, hoje, temos quatro oradores. 18 00:01:08,387 --> 00:01:09,876 Três mais um. 19 00:01:09,876 --> 00:01:13,636 Por isso, quero pedir-lhes para subirem ao palco, 20 00:01:13,636 --> 00:01:15,165 para que vos possa apresentar. 21 00:01:22,394 --> 00:01:24,895 Temos a Susanna Ånäs. 22 00:01:25,385 --> 00:01:29,296 Ela é activista pelo conhecimento livre há muito tempo 23 00:01:29,296 --> 00:01:31,601 e está envolvida em vários WikiProjects. 24 00:01:31,916 --> 00:01:35,526 E vai fazer hoje o relatório do projeto em cooperação 25 00:01:35,526 --> 00:01:38,396 com a Biblioteca Nacional da Finlândia. 26 00:01:38,856 --> 00:01:43,435 Depois temos, ao meu lado, Mike Dickison, 27 00:01:43,435 --> 00:01:46,325 que vai ser o segundo orador. 28 00:01:46,995 --> 00:01:50,283 Ele é curador num museu na Nova Zelândia. 29 00:01:50,283 --> 00:01:53,815 É zoólogo e editor da Wikipedia. 30 00:01:53,815 --> 00:01:58,788 E foi o primeiro Wikipedian da Nova Zelândia em residência 31 00:01:58,788 --> 00:02:02,565 em 2018 e 2019. 32 00:02:02,565 --> 00:02:06,634 Vai contar-nos sobre a sua experiência neste papel 33 00:02:06,634 --> 00:02:13,105 e o que está a ser feito no contexto de trabalho para a Wikidata. 34 00:02:15,784 --> 00:02:20,480 Depois vamos ter Joachim Neubert vindo do Centro de Informação 35 00:02:20,480 --> 00:02:23,461 para a Economia de Leibniz em Kiel e Hamburgo. 36 00:02:24,011 --> 00:02:29,131 Esteve a trabalhar para fazer o maior arquivo público mundial de imprensa 37 00:02:29,131 --> 00:02:34,655 mais acessível ao público, e está a utilizar a Wikidata para isso. 38 00:02:35,890 --> 00:02:38,091 Eu serei o último a falar. 39 00:02:38,091 --> 00:02:39,468 O meu nome é Beat Estermann. 40 00:02:39,468 --> 00:02:43,080 Trabalho para a Universidade de Berna de Ciências Aplicadas, na Suiça. 41 00:02:43,640 --> 00:02:49,950 Tenho sido um promotor, há muito tempo, da OpenGLAM na Suiça e Áustria. 42 00:02:50,975 --> 00:02:55,610 Hoje, falo-vos sobre as minhas atividades em ligação com o mandato 43 00:02:55,610 --> 00:02:59,460 da Associação de Representação de Artes Canadiana, 44 00:02:59,460 --> 00:03:01,270 focadas nas artes performativas. 45 00:03:02,121 --> 00:03:04,440 Não principalmente na Wikidata, 46 00:03:04,510 --> 00:03:08,491 mas verão que a Wikidata está a começar a ter um papel ativo, também ali. 47 00:03:08,970 --> 00:03:13,250 Agora, a maior parte de nós vai sentar-se por aqui, 48 00:03:13,250 --> 00:03:16,980 e vou dar o palco à Susanna. 49 00:03:20,680 --> 00:03:23,690 Olá, o meu nome é Susanna Ånäs. 50 00:03:23,690 --> 00:03:25,769 Trabalho em part-time para a Wikimedia Finlândia 51 00:03:25,769 --> 00:03:27,079 como coordenadora para a GLAM 52 00:03:27,079 --> 00:03:32,655 e faço também consultoria na esfera do conhecimento livre. 53 00:03:32,655 --> 00:03:36,049 Este é um discurso, talvez de, falar da consultoria e não do part-time. 54 00:03:36,549 --> 00:03:39,219 Tenho estado envolvida em temas 55 00:03:40,089 --> 00:03:45,539 de grupos de dados geográficos, 56 00:03:45,539 --> 00:03:48,299 de... 57 00:03:48,299 --> 00:03:51,147 Bem, fui verificar os termos em Inglês, 58 00:03:51,147 --> 00:03:54,497 tem a ver com uma iniciativa cultural hereditária do Governo da Finlândia. 59 00:03:56,077 --> 00:03:59,752 Isto tem a ver com nomes de locais 60 00:03:59,752 --> 00:04:03,300 e como são representados 61 00:04:03,300 --> 00:04:07,466 nos diferentes repositórios no setor da GLAM na Finlândia 62 00:04:07,466 --> 00:04:11,755 e como estão a tentar conciliar as diferentes fontes de informação 63 00:04:11,755 --> 00:04:17,906 e como estão a informar-se modelando na Wikidata e outros locais. 64 00:04:17,906 --> 00:04:23,315 Aqui podemos ver as três grandes fontes de informação para estes locais YSO, 65 00:04:23,315 --> 00:04:27,944 que fazem parte da ontologia nacional, ontologia geral. 66 00:04:27,944 --> 00:04:29,665 AHAA são os arquivos finlandeses, 67 00:04:29,665 --> 00:04:31,645 Melinda são as bibliotecas finlandesas, 68 00:04:31,645 --> 00:04:33,750 e KOOKOS são os museus finlandeses. 69 00:04:33,750 --> 00:04:37,585 Existem também, três sistemas de gestão de conteúdo 70 00:04:37,585 --> 00:04:40,290 que são conciliados nesses locais YSO. 71 00:04:40,745 --> 00:04:47,365 Existem, também, intercâmbios entre a Wikidata a funcionar, 72 00:04:47,965 --> 00:04:53,065 assim como o projeto de nomes para o Cadastro Nacional de Terrenos. 73 00:04:53,065 --> 00:04:56,285 E existe um terceiro projeto, o Arquivo de Nomes Finlandês, 74 00:04:56,285 --> 00:05:00,391 que ainda não contribui para isto, 75 00:05:00,391 --> 00:05:02,715 mas existem planos para que o faça. 76 00:05:02,715 --> 00:05:09,175 Um dos assuntos de modelação principais nesta área problemática 77 00:05:09,175 --> 00:05:15,226 é que existem três tipos de elementos de nomenclatura 78 00:05:16,116 --> 00:05:18,195 representados neste projeto. 79 00:05:18,195 --> 00:05:21,236 Um deles é o local, o que tem a localização. 80 00:05:21,236 --> 00:05:24,766 E outro é a nomenclatura, a toponímia, por exemplo. 81 00:05:25,006 --> 00:05:27,696 Depois, existem as fontes, que são documentos 82 00:05:27,696 --> 00:05:30,756 dos quais os dois anteriores podem derivar, 83 00:05:30,756 --> 00:05:32,565 ou, serem suportados. 84 00:05:32,565 --> 00:05:35,845 Os locais YSO, aqui, no canto superior direito, 85 00:05:35,845 --> 00:05:38,799 verão o mesmo diagrama de novo. 86 00:05:38,799 --> 00:05:41,189 Foca-se maioritariamente nos locais. 87 00:05:42,619 --> 00:05:46,279 O aspecto principal disto é a Biblioteca Nacional Finlandesa, 88 00:05:46,279 --> 00:05:49,159 e o Projeto Finto. 89 00:05:50,199 --> 00:05:55,608 Existem agora mais de 7,000 locais em finlandês e sueco 90 00:05:55,608 --> 00:05:59,438 e mais de 3,000 em inglês, 91 00:05:59,438 --> 00:06:03,042 e são CC0 com quem nós licenciámos. 92 00:06:03,042 --> 00:06:06,008 Aqui podem ver o serviço do Finto. 93 00:06:06,008 --> 00:06:09,883 e um local, escolhi Sevettijärvi. 94 00:06:09,883 --> 00:06:13,908 Está agora também relacionado com o nosso projeto linguístico 95 00:06:13,908 --> 00:06:15,268 com o Skolt Sámi... 96 00:06:15,268 --> 00:06:18,877 É um local no norte longínquo da Finlândia 97 00:06:18,877 --> 00:06:21,651 habitado por Skolt Sámi. 98 00:06:22,798 --> 00:06:27,239 Aqui podem ver o local que pertence a... 99 00:06:28,405 --> 00:06:33,057 Aqui podem ver dados sobre este local. 100 00:06:33,057 --> 00:06:37,624 Podem ver que está ligado à Wikidata, 101 00:06:37,624 --> 00:06:42,189 e também a estes dados cartográficos nacionais. 102 00:06:43,366 --> 00:06:47,044 Aqui vamos. E podem ver com mais detalhes, aqui. 103 00:06:48,996 --> 00:06:52,696 Está também hierarquicamente arranjado 104 00:06:52,696 --> 00:06:57,405 dentro deste repositório, para que... 105 00:06:57,580 --> 00:07:00,460 Bem, na realidade, o local em si não é visto, 106 00:07:00,460 --> 00:07:05,880 mas está por baixo desta municipalidade, 107 00:07:05,880 --> 00:07:08,010 como também da região 108 00:07:08,010 --> 00:07:10,154 e da Finlândia como país e países nórdicos, 109 00:07:10,154 --> 00:07:12,650 como região fronteiriça. 110 00:07:12,650 --> 00:07:14,400 Aqui podem ver que muitos destes 111 00:07:14,400 --> 00:07:17,891 foram conciliados com a Wikidata anteriormente 112 00:07:18,730 --> 00:07:22,230 através de Mix'n'Match, e que existem ainda alguns remanescentes. 113 00:07:22,230 --> 00:07:27,900 Mas mesmo assim o número de nomes não é assim tão alto. 114 00:07:28,411 --> 00:07:30,844 São menos de 5,000. 115 00:07:31,570 --> 00:07:33,860 E existe este outro repositório 116 00:07:33,860 --> 00:07:38,040 propriedade do Projeto de Plataforma Geoespacial Finlandês... 117 00:07:38,040 --> 00:07:39,199 Quadros de Nomes de Locais. 118 00:07:39,199 --> 00:07:41,729 Estes são nomes de locais que estão no mapa Finlandês. 119 00:07:42,130 --> 00:07:48,308 E têm os dados ligados, licenciados como CC BY 4.0. 120 00:07:48,518 --> 00:07:54,478 800,000 nomes em Finlandês, Sueco e nas outras três línguas Saami 121 00:07:54,478 --> 00:07:55,778 que existem na Finlândia. 122 00:07:55,997 --> 00:07:58,877 Depois têm dois tipos de entidades. 123 00:07:58,877 --> 00:08:00,680 Outros são locais, e os outros 124 00:08:00,680 --> 00:08:02,651 são nomes de locais, topónimos. 125 00:08:02,651 --> 00:08:05,271 Ambos têm URIs (identificador uniforme de recurso). 126 00:08:06,001 --> 00:08:09,721 Aqui, por exemplo, o mesmo Sevettijärvi, primeiro em finlandês, 127 00:08:09,721 --> 00:08:14,001 e depois nas outras três línguas Saami, bem como os dados geográficos. 128 00:08:14,001 --> 00:08:20,526 Por último, temos mais informação sobre isso, como o tipo de local, etc. 129 00:08:21,640 --> 00:08:28,641 Aqui, vemos o quadro para o nome do local, o topónimo, a ter o seu próprio URI. 130 00:08:29,943 --> 00:08:33,738 Desculpem, parece que não está traduzido para inglês. 131 00:08:34,432 --> 00:08:39,151 Então, as multilínguas não abrangem o projeto inteiro. 132 00:08:39,847 --> 00:08:42,523 Chegámos ao Arquivo de Nomes Finlandeses. 133 00:08:42,523 --> 00:08:46,234 Este projeto é do Instituto de Línguas da Finlândia, 134 00:08:46,234 --> 00:08:50,456 que não representa locais, nem os nomes dos locais, 135 00:08:50,456 --> 00:08:52,603 mas sim a origem disso tudo. 136 00:08:52,603 --> 00:08:57,123 São três milhões de campos de notas de nomes de locais, 137 00:08:57,723 --> 00:08:59,529 e é um projeto Wikibase. 138 00:08:59,529 --> 00:09:03,325 Estão numa Wikibase, principalmente em finlandês, mas alguns também em sueco. 139 00:09:03,325 --> 00:09:08,111 Uma espantosa coleção de nomes em Saami, nos quais estamos bastante interessados. 140 00:09:08,111 --> 00:09:10,141 E estão licenciados em CC BY. 141 00:09:11,540 --> 00:09:14,850 Isto também é um desafio do ponto de vista da Wikidata. 142 00:09:14,850 --> 00:09:17,640 Mas se houvesse uma Wikibase local finlandesa, 143 00:09:17,640 --> 00:09:22,632 éramos capazes de trabalhar primeiro neles dentro desse projeto. 144 00:09:23,034 --> 00:09:25,343 Então, aqui temos uma imagem disso, 145 00:09:26,443 --> 00:09:31,323 que mostra que existe informação sobre o local, os mapas... 146 00:09:31,323 --> 00:09:35,227 dos mapas que os colectores usaram inicialmente. 147 00:09:35,227 --> 00:09:40,713 e um quadro que produziram a partir da informação recolhida. 148 00:09:41,245 --> 00:09:46,416 Aqui está um desses quadros 149 00:09:46,416 --> 00:09:48,736 decomposto nos dados 150 00:09:48,736 --> 00:09:50,676 que está incluído nele. 151 00:09:51,156 --> 00:09:53,751 Eles enviaram este projeto de dados sincronizados 152 00:09:53,751 --> 00:09:58,256 pelo Helsinki Digital Humanities Lab and Semantic Computers, 153 00:09:58,256 --> 00:10:01,446 o grupo de computação da Universidade de Aalto 154 00:10:01,446 --> 00:10:06,525 em conjunto com o Instituto para as Línguas da Finlândia... 155 00:10:06,525 --> 00:10:07,994 o Names Sampo. 156 00:10:07,994 --> 00:10:11,024 Este é um interface agregado de pesquisa 157 00:10:11,024 --> 00:10:13,503 para várias fontes de nomes. 158 00:10:13,503 --> 00:10:17,704 Aqui conseguem ver que várias das fontes estão aqui à esquerda 159 00:10:17,704 --> 00:10:20,763 e que podem fazer vários tipos de visualização 160 00:10:20,763 --> 00:10:22,653 baseados nestes dados. 161 00:10:27,259 --> 00:10:30,603 Tenho trazido esta ideia de modelação para uma Wikibase local 162 00:10:30,603 --> 00:10:32,683 que poderiamos fazer com estes dados. 163 00:10:33,133 --> 00:10:36,580 Mas, quando entramos nestas questões de modelação, 164 00:10:36,580 --> 00:10:37,770 como o faremos? 165 00:10:37,770 --> 00:10:41,589 Existem várias formas, diferentes tradições em cada um deles. 166 00:10:46,782 --> 00:10:50,360 A boa noticia é que podemos servir línguas minoritárias 167 00:10:50,360 --> 00:10:52,475 com muito pouco esforço. 168 00:10:53,243 --> 00:10:57,179 Então, aqui temos as duas opões básicas: 169 00:10:57,179 --> 00:11:01,660 o modelo SAPO, que é a Ontologia Finlandesa Espaço-Tempo, 170 00:11:02,841 --> 00:11:04,421 e o modelo Wikidata. 171 00:11:04,421 --> 00:11:07,909 Aqui podem ver que os itens Wikidata tendem para ser zero. 172 00:11:07,909 --> 00:11:12,871 Idealmente, permanecem sem alteração com as propriedades modificadas. 173 00:11:12,871 --> 00:11:16,909 Enquanto no modelo SAPO, estes itens tornam-se novos 174 00:11:16,909 --> 00:11:20,399 quando existe uma modificação, tal como mudança de área e nome. 175 00:11:21,179 --> 00:11:26,219 Então, aqui, voltando atrás para esta divisão 176 00:11:26,219 --> 00:11:31,719 entre estas três dimensões diferentes de locais, nomes de locais. 177 00:11:32,099 --> 00:11:37,659 Devemos colocar estes nomes de locais em entidades ou propriedades? 178 00:11:37,659 --> 00:11:39,248 A Wikidata usa propriedades, 179 00:11:39,248 --> 00:11:43,098 enquanto este projeto de cartografia utiliza entidades. 180 00:11:43,838 --> 00:11:46,177 Ou devemos torná-la um lexema? 181 00:11:46,177 --> 00:11:51,426 A Wikidata escolheu trabalhar com propriedades, 182 00:11:51,426 --> 00:11:54,956 propriedades textuais para nomes de locais ao invés de lexemas. 183 00:11:55,567 --> 00:11:57,818 Lamento, é o contrário. 184 00:11:57,818 --> 00:11:59,631 Então, os nomes são... 185 00:12:03,056 --> 00:12:04,941 propriedades, não lexemas. 186 00:12:05,874 --> 00:12:06,877 Certo. 187 00:12:07,425 --> 00:12:11,472 E talvez a falha da Wikibase 188 00:12:11,472 --> 00:12:16,340 seja a falta de formas geográficas dentro disso... 189 00:12:16,340 --> 00:12:20,958 Como a configuração base disso, 190 00:12:20,958 --> 00:12:24,748 para que cada um possa adicionar mais tecnologia à pilha 191 00:12:24,748 --> 00:12:29,865 de forma a poder utilizar formas geográficas locais. 192 00:12:29,865 --> 00:12:31,823 O que é realmente preciso é uma federação 193 00:12:31,823 --> 00:12:38,328 para se conseguir tirar partido do colectivo da Wikidata. 194 00:12:38,758 --> 00:12:43,052 E penso que terminei. Obrigada. 195 00:12:43,616 --> 00:12:45,530 (orador a rir) 196 00:12:45,530 --> 00:12:49,057 (aplausos) 197 00:13:01,115 --> 00:13:02,514 Está bem. 198 00:13:03,134 --> 00:13:05,011 (orador a falar em maori) 199 00:13:05,011 --> 00:13:07,655 Bem vindos a todos. O meu nome é Mike Dickison. 200 00:13:08,375 --> 00:13:10,149 Por um ano, 201 00:13:10,149 --> 00:13:13,075 fui o Wikipedista da Nova Zelândia em residência. 202 00:13:13,935 --> 00:13:16,935 Devem estar a perguntar-se o que é um Wikipedista em residência. 203 00:13:17,856 --> 00:13:21,875 Porque se forem mesmo procurar o que é, não existe tal termo, como podemos ver. 204 00:13:22,735 --> 00:13:25,855 É um termo que eu inventei na proposta de bolsa, 205 00:13:26,153 --> 00:13:29,003 e do qual a fundação pareceu gostar imenso. 206 00:13:29,983 --> 00:13:31,533 E como tal, avançámos com ele. 207 00:13:32,303 --> 00:13:36,510 Por isso, por um ano, passei por 35 instituições diferentes, 208 00:13:37,473 --> 00:13:41,473 tive estagiários, e muitas vezes, dei sessões de treino. 209 00:13:41,493 --> 00:13:44,363 Organizei eventos públicos, e tentei desenvolver 210 00:13:44,363 --> 00:13:47,230 uma estratégia Wikimedia para cada um deles. 211 00:13:47,808 --> 00:13:49,498 Foi uma experiência bastante interessante, 212 00:13:49,498 --> 00:13:52,997 e encontra-se uma variedade ampla de diferentes projetos e pessoas. 213 00:13:53,297 --> 00:13:58,211 Queria tentar falar de alguns dos diferentes projetos 214 00:13:58,211 --> 00:14:00,345 que lidaram com a Wikidata 215 00:14:00,872 --> 00:14:05,171 de formas interessantes ou talvez, de formas iluminadas, 216 00:14:05,171 --> 00:14:07,591 que talvez sejam úteis para as pessoas discutirem. 217 00:14:08,561 --> 00:14:11,961 O projeto foi inicialmente um projeto Wikipédia, pelo nome, 218 00:14:11,961 --> 00:14:14,811 simplesmente porque era com isso que as pessoas estavam familiarizadas. 219 00:14:15,281 --> 00:14:18,360 Como tal, organizámos vários eventos diferentes 220 00:14:18,360 --> 00:14:23,135 em editatonas bem tradicionais, trabalho para a igualdade de género, etc. 221 00:14:24,607 --> 00:14:26,752 E uma quantidade grande de...[inaudível] 222 00:14:27,410 --> 00:14:30,812 E uma quantidade grande de novos editores recrutados, bem sucedidos, etc. 223 00:14:31,754 --> 00:14:34,454 Fizemos carregamentos de volume para o Commons. 224 00:14:35,454 --> 00:14:41,246 Neste caso, existia uma coleção de mais de 1,000 desenhos originais 225 00:14:41,246 --> 00:14:46,047 feitos por um ilustrador entomólogo, Des Helmore, 226 00:14:46,047 --> 00:14:47,927 que estiveram parados dentro de um disco rígido, 227 00:14:47,927 --> 00:14:50,357 à espera de pesquisa durante uns 10 anos. 228 00:14:50,357 --> 00:14:54,182 Conseguimos autorização para os libertar dentro de uma licença CC BY. 229 00:14:54,182 --> 00:14:57,963 Sabem como é. Vitórias fáceis para mostrar às pessoas por lá. 230 00:14:57,963 --> 00:15:01,095 Qualquer um pode perceber várias fotografias dos escaravelhos. 231 00:15:01,095 --> 00:15:06,903 Qualquer um entende workshops dedicadas a tentar colmatar a igualdade de género. 232 00:15:07,250 --> 00:15:10,061 Mas a Wikidata é muito mais difícil de vender 233 00:15:10,061 --> 00:15:12,696 a pessoas no setor GLAM, (galerias, bibliotecas, arquivos e museus) 234 00:15:12,696 --> 00:15:15,095 ou a alguém fora do nosso movimento tão particular. 235 00:15:16,107 --> 00:15:19,717 Então, comecei a aperceber-me que a Wikidata 236 00:15:19,717 --> 00:15:22,634 ia ser uma parte cada vez mais importante 237 00:15:22,634 --> 00:15:25,883 de projetos de Wikipedistas em residência. 238 00:15:25,883 --> 00:15:30,472 À medida que íamos avançando, tornou-se um componente cada vez maior 239 00:15:30,472 --> 00:15:31,849 do que eu estava a fazer. 240 00:15:31,849 --> 00:15:36,350 E comecei a tentar aprender sozinho também sobre a Wikidata, 241 00:15:36,800 --> 00:15:39,515 porque estava a aperceber-me do quão importante era. 242 00:15:40,287 --> 00:15:41,989 Então, este projeto em específico... 243 00:15:41,989 --> 00:15:46,325 O kakapo é um papagaio neozelandês que não voa. 244 00:15:47,816 --> 00:15:51,335 Trabalhámos com o Departamento de Conservação, 245 00:15:51,335 --> 00:15:54,299 que tem como trabalho salvar esta espécie de extinção 246 00:15:54,299 --> 00:15:55,643 e demos a ideia: 247 00:15:55,643 --> 00:15:59,253 "E se, pusessemos cada um dos kakapos na Wikidata?" 248 00:15:59,707 --> 00:16:01,057 (risos) 249 00:16:01,161 --> 00:16:02,701 E isto até pode parecer ridículo, 250 00:16:02,701 --> 00:16:05,580 mas é, na realidade, um projeto perfeitamente viável. 251 00:16:06,231 --> 00:16:08,427 Alguns já se encontram inclusivamente lá. 252 00:16:09,037 --> 00:16:11,717 Uma coisa chave a reparar é que não existem assim tantos kakapos. 253 00:16:11,717 --> 00:16:13,245 Por isso, é uma tarefa fazível. 254 00:16:13,245 --> 00:16:16,815 Existiam 148 quando comecei e depois um morreu. 255 00:16:16,815 --> 00:16:20,995 E agora tiveram uma temporada de reprodução excelente até aos 213. 256 00:16:21,765 --> 00:16:25,045 Isto é excelente. É o maior número de kakapos desde há mais de 50 anos. 257 00:16:25,505 --> 00:16:28,260 Por isso, isto foi também muito importante. 258 00:16:28,260 --> 00:16:30,725 Isto esteve nas notícias, todos os dias, na Nova Zelândia. 259 00:16:31,285 --> 00:16:33,134 Cada um que nascia... 260 00:16:33,134 --> 00:16:34,414 (plateia 1) No New York Times. 261 00:16:34,414 --> 00:16:35,733 (Mike) A sério? Oh, que bom. 262 00:16:35,803 --> 00:16:38,472 Sim, foram notícias internacionais. Toda a gente gosta destas aves. 263 00:16:39,002 --> 00:16:40,663 Mas uma coisa interessante sobre eles 264 00:16:40,663 --> 00:16:43,932 é que, ao contrário de espécies que são mais numerosas, 265 00:16:43,932 --> 00:16:47,822 cada um dos kakapos tem nome, um nome único 266 00:16:47,822 --> 00:16:49,817 e um número de bilhete de identidade. 267 00:16:49,817 --> 00:16:52,442 E geralmente tem uma boa quantidade de dados biográficos 268 00:16:52,442 --> 00:16:54,672 sobre onde e quando nasceram, 269 00:16:54,672 --> 00:16:56,972 quando chocaram, quem foi o pai e a mãe, 270 00:16:56,972 --> 00:16:58,713 quando morreram, se morreram. 271 00:16:58,713 --> 00:17:01,352 Existe, de facto, uma base de dados do Departamento de Conservação 272 00:17:01,352 --> 00:17:02,882 com esta informação toda. 273 00:17:02,882 --> 00:17:06,723 E um dos mais famosos kakapos é o Sirocco, claro, 274 00:17:06,723 --> 00:17:09,726 que, como podem ver, foi nomeado a partir de um vento, nasceu ali. 275 00:17:09,726 --> 00:17:13,225 O Sirocco tem uma conta de Twitter, 276 00:17:13,705 --> 00:17:15,927 com a qual a Wikidata teve alguns problemas, 277 00:17:15,927 --> 00:17:18,562 porque, aparentemente, pássaros não podem ter contas do Twitter. 278 00:17:18,562 --> 00:17:20,342 Tenho dúvidas sobre isso. 279 00:17:21,051 --> 00:17:23,456 Ele entrou inclusivamente na capa de um álbum, e por aí fora. 280 00:17:23,456 --> 00:17:25,716 Por isso existem múltiplas propriedades disto, 281 00:17:25,716 --> 00:17:28,258 provavelmente um dos mais famosos kakapos. 282 00:17:28,258 --> 00:17:30,337 Abordei o Departamento de Conservação, 283 00:17:30,337 --> 00:17:33,245 "Porque é que não tentamos fazer isto com os outros todos?" 284 00:17:33,245 --> 00:17:38,764 Então, tiveram de pensar em que dados biográficos podiam tornar públicos. 285 00:17:39,375 --> 00:17:41,375 E voltaram com uma lista bem curta. 286 00:17:41,375 --> 00:17:47,061 E agora temos, penso eu, 212, 210-- penso que um casal morreu-- 287 00:17:47,061 --> 00:17:50,394 kakapos vivos todos eles candidatos. 288 00:17:50,394 --> 00:17:52,925 Só lhes é dado um nome quando as asas se desenvolvem totalmente. 289 00:17:52,925 --> 00:17:55,525 Enquanto são bebés só têm um código. 290 00:17:56,248 --> 00:18:00,130 Portanto, quando forem todos adultos, vamos criar 291 00:18:00,759 --> 00:18:02,067 uma Wikidata completa... 292 00:18:02,067 --> 00:18:04,108 a espécie completa estará na Wikidata. 293 00:18:04,446 --> 00:18:06,751 Mas precisamos de encontrar uma propriedade para DOC ID... 294 00:18:06,751 --> 00:18:08,875 Queria mesmo falar convosco acerca disso. 295 00:18:08,875 --> 00:18:11,266 Devemos usar uma ID específica, 296 00:18:11,266 --> 00:18:13,136 ou devemos encontrar uma ID 297 00:18:13,136 --> 00:18:18,245 que seja válida para todos os indivíduos, sejam eles aves, plantas ou animais 298 00:18:18,245 --> 00:18:21,965 que forem marcados em algum projeto de pesquisa científica? 299 00:18:21,965 --> 00:18:24,083 É uma boa questão. 300 00:18:25,105 --> 00:18:27,465 O segundo projeto foi a Galeria de Arte de Christchurch. 301 00:18:28,225 --> 00:18:31,523 Estão lá algumas pinturas de Colin MacCahon, 302 00:18:31,523 --> 00:18:33,963 o artista neozelandês mais famoso na História. 303 00:18:33,963 --> 00:18:36,704 Este é um desenho que ele fez para o New Zealand School Journal, 304 00:18:36,704 --> 00:18:38,424 patrocinado na altura pelo governo. 305 00:18:38,424 --> 00:18:40,704 Por isso, está atualmente nos Arquivos da Nova Zelândia 306 00:18:40,704 --> 00:18:42,403 que têm o seu copyright. 307 00:18:42,403 --> 00:18:44,333 Esta é uma situação que não é usual. 308 00:18:45,014 --> 00:18:47,073 Trabalhei com a Galeria de Arte de Christchurch 309 00:18:47,073 --> 00:18:49,117 que, em conjunto com a Galeria de Arte de Auckland, 310 00:18:49,117 --> 00:18:52,954 mantêm um site chamado Find New Zealand artists. 311 00:18:52,954 --> 00:18:55,654 Que tem como função manter o rasto às posses... 312 00:18:55,654 --> 00:18:58,403 cada instituição que tenha posses de algum artista neozelandês. 313 00:18:58,403 --> 00:19:03,163 Existem perto de 18,000 artistas diferentes na sua base de dados, 314 00:19:03,163 --> 00:19:05,517 e a maior parte com muito pouca informação. 315 00:19:06,233 --> 00:19:08,992 Então, fizemos um tipo de procura standard de Mix'n'Match. 316 00:19:08,992 --> 00:19:13,673 Exportámos os que tinham pelo menos a data de nascimento, 317 00:19:13,673 --> 00:19:17,665 ou data de morte, ou local de nascimento, ou local de morte. 318 00:19:17,665 --> 00:19:20,534 Por isso, não é restringir muito. 319 00:19:20,534 --> 00:19:23,484 E mesmo assim, não fomos capazes de encontrar a correspondência de alguns, 320 00:19:23,484 --> 00:19:25,954 mas agora já temos perto de 1,500 321 00:19:25,954 --> 00:19:28,603 que correspondem a artistas conhecidos na Wikidata, 322 00:19:28,603 --> 00:19:30,123 o que é muito bom. 323 00:19:30,123 --> 00:19:31,783 Mas o que foi apelativo para eles... 324 00:19:31,783 --> 00:19:33,523 Este é o website deles, 325 00:19:33,523 --> 00:19:39,213 que, na realidade, só mantém as ligações para os recursos. 326 00:19:39,213 --> 00:19:44,523 Mas estes dados biográficos, que mantêm atualmente de forma manual, 327 00:19:44,523 --> 00:19:46,063 para todos os artistas. 328 00:19:46,063 --> 00:19:48,803 E o ato de exportar e colocar no Mix'n'Match 329 00:19:48,803 --> 00:19:53,640 expôs inúmeras gralhas e erros nos quais eles não tinham reparado. 330 00:19:53,640 --> 00:19:56,123 E é somente quando começas a executar coisas [em Excel], 331 00:19:56,123 --> 00:19:57,917 que este tipo de situações aparecem. 332 00:19:57,917 --> 00:20:01,720 E o valor da Wikidata de repente começou a fazer-lhes sentido 333 00:20:01,720 --> 00:20:05,527 quando eu disse, "Podem simplesmente carregar essa informação da Wikidata." 334 00:20:07,618 --> 00:20:09,507 Isso fê-los sentarem-se direitos na cadeira. 335 00:20:09,507 --> 00:20:11,748 Por isso, penso eu, este é um dos pontos que vende. 336 00:20:11,748 --> 00:20:14,907 Quando têm este website curado à mão 337 00:20:14,907 --> 00:20:19,344 com 18,000 entradas, cheio de erros e lhes dizem que existe outra forma, 338 00:20:19,344 --> 00:20:20,558 que podem ter outras pessoas 339 00:20:20,558 --> 00:20:23,192 a fazer a verificação dos factos e correcção por eles... 340 00:20:23,192 --> 00:20:24,813 é quando eles se apercebem. 341 00:20:25,413 --> 00:20:27,293 E depois anunciei que estava a dar a ideia 342 00:20:27,293 --> 00:20:30,313 que eles "Wikidataficassem" este caderno de história deles, 343 00:20:30,313 --> 00:20:33,333 dos artistas neozelandeses em Christchurch nos anos 30, 344 00:20:33,333 --> 00:20:36,833 e que percorressem-- só agora publicado-- e que percorressem cada pessoa singular, 345 00:20:36,833 --> 00:20:39,779 cada ligação, local, exibição e afins. 346 00:20:39,779 --> 00:20:43,103 Mas é um projeto de tamanho gerenciável, e eles estão excitadíssimos com isso. 347 00:20:44,433 --> 00:20:46,963 Em terceiro lugar, queria mostrar-lhes o Maori Subject Headings. 348 00:20:46,963 --> 00:20:50,811 Waka é um nome Maori para um tipo particular de canoa, 349 00:20:50,811 --> 00:20:52,732 uma canoa de guerra. 350 00:20:52,732 --> 00:20:55,952 Na Biblioteca Nacional da Nova Zelândia 351 00:20:55,952 --> 00:20:58,530 existe uma lista de waka, porque a Biblioteca Nacional 352 00:20:58,530 --> 00:21:02,805 tem atualmente o seu próprio dicionário de Maori Subject Headings, 353 00:21:03,299 --> 00:21:04,474 escrito em Maori. 354 00:21:04,474 --> 00:21:06,475 Então, lá está definida a waka, 355 00:21:08,515 --> 00:21:10,182 em Maori e Inglês. 356 00:21:10,182 --> 00:21:12,540 Mas também tem muitos termos de terminologia mais reduzida, 357 00:21:12,540 --> 00:21:14,222 podem vê-los ali na lateral. 358 00:21:14,222 --> 00:21:16,062 Uma típica poderia ser taurapa. 359 00:21:16,237 --> 00:21:19,774 E a definição primeiro em maori, e depois em inglês. 360 00:21:19,774 --> 00:21:22,249 É o mastro esculpido que podem ver ali. 361 00:21:22,695 --> 00:21:24,482 E, em inglês, deveriam dizer "mastro", 362 00:21:24,482 --> 00:21:26,959 mas não podem usar a palavra "mastro" para taurapa, 363 00:21:26,959 --> 00:21:31,054 porque taurapa só funciona para modelos únicos de canoas de guerra. 364 00:21:31,420 --> 00:21:34,460 Por isso, não existe equivalente em inglês para isso. 365 00:21:35,108 --> 00:21:37,909 E, de repente, apercebo-me que existe uma ontologia inteira 366 00:21:37,909 --> 00:21:42,177 de termos culturais específicos e que foram cuidadosamente trabalhados 367 00:21:42,177 --> 00:21:45,043 e verificados pela Biblioteca Nacional com os Maori. 368 00:21:45,043 --> 00:21:49,733 sendo constantemente adicionados e melhorados com definições e descrições, 369 00:21:49,733 --> 00:21:51,803 em maori e inglês. 370 00:21:51,803 --> 00:21:52,956 Muito interessante. 371 00:21:52,956 --> 00:21:56,228 De repente, pensei que pudessemos colocar este lote inteiro na Wikidata... 372 00:21:56,228 --> 00:22:00,596 Maori primeiro e depois traduzido para inglês, como requisitado. 373 00:22:00,596 --> 00:22:02,291 Seria uma boa mudança, não? 374 00:22:03,081 --> 00:22:05,046 E aqui está a cópia de direitos de autor. 375 00:22:05,046 --> 00:22:08,726 Infelizmente, uma licença de Atribuição-NãoComercial-SemDerivações. 376 00:22:10,346 --> 00:22:12,562 Por isso, agora vou ter de iniciar a conversa com eles 377 00:22:12,562 --> 00:22:14,524 sobre o porquê de terem escolhido essa licença. 378 00:22:15,675 --> 00:22:19,970 Muito possivelmente porque a conseguiram comprar de Maoris, 379 00:22:19,970 --> 00:22:22,679 que aceitaram sentar-se com eles e vender esta coisa 380 00:22:22,679 --> 00:22:24,039 só se houvesse uma garantia 381 00:22:24,039 --> 00:22:27,339 de que nenhuma dessa informação pudesse ser utilizada com propósitos comerciais. 382 00:22:28,027 --> 00:22:31,999 Um dos aspetos frustantes da tarefa 383 00:22:31,999 --> 00:22:34,238 é ir contra este tipo de restrições. 384 00:22:34,238 --> 00:22:37,892 Estas eram as três coisas que queria trazer à discussão. 385 00:22:38,379 --> 00:22:40,878 Pôr uma espécie inteira dentro da Wikidata, 386 00:22:40,878 --> 00:22:44,107 O que faz alterar a forma de pensar de um curador de uma galeria de arte 387 00:22:44,107 --> 00:22:46,078 acerca do valor da Wikidata. 388 00:22:46,078 --> 00:22:49,838 E o que fazemos quando vemos uma ontologia completa 389 00:22:49,838 --> 00:22:52,477 noutra língua que, infelizmente, foi presenteada 390 00:22:52,477 --> 00:22:55,697 com uma licença restritiva da Creative Commons. 391 00:22:55,697 --> 00:22:56,997 Obrigado. 392 00:22:56,997 --> 00:23:02,047 (aplausos) 393 00:23:11,412 --> 00:23:13,761 Olá, chamo-me Joachim Neubert. 394 00:23:14,077 --> 00:23:16,472 Trabalho para a ZBW, 395 00:23:17,691 --> 00:23:21,151 que é o Centro de Informação Económica em Hamburgo, 396 00:23:21,407 --> 00:23:23,796 como programador de software científico. 397 00:23:25,496 --> 00:23:27,662 Uma das minhas tarefas no ano passado 398 00:23:27,662 --> 00:23:31,288 foi preparar uma doação de dados para a Wikidata. 399 00:23:32,028 --> 00:23:37,303 E quero deixar o meu relato sobre isto, das nossas primeiras experiências 400 00:23:37,613 --> 00:23:43,259 de doar metadados dos Arquivos de Imprensa do Século XX. 401 00:23:46,463 --> 00:23:48,299 Que tenhamos conhecimento, 402 00:23:48,299 --> 00:23:52,678 este é o maior arquivo público de imprensa do mundo. 403 00:23:54,018 --> 00:23:59,158 Foi reunido entre 1908 e 2005, 404 00:24:01,008 --> 00:24:04,244 e foi conseguido a partir de 405 00:24:05,174 --> 00:24:08,995 mais de 1,500 jornais e periódicos 406 00:24:09,614 --> 00:24:13,412 alemães e também internacionais. 407 00:24:14,651 --> 00:24:18,841 E cobre tudo o que possa ser de interesse 408 00:24:18,841 --> 00:24:22,820 para Hamburgo, 409 00:24:25,870 --> 00:24:28,030 para as pessoas de negócios 410 00:24:28,030 --> 00:24:32,410 que quisessem expandir-se pelo mundo. 411 00:24:34,611 --> 00:24:39,350 Como podem ver, este material foi trazido de jornais 412 00:24:39,350 --> 00:24:41,790 e colocado em papel, 413 00:24:41,790 --> 00:24:44,731 e depois guardados em dossiers. 414 00:24:46,121 --> 00:24:50,451 Aqui podem ver um pequeno canto do Arquivo de Pessoas. 415 00:24:52,013 --> 00:24:56,182 Informação similar foi reunida de empresas, 416 00:24:56,182 --> 00:25:00,843 de tópicos gerais, de artigos, de toda a gente, 417 00:25:01,614 --> 00:25:05,828 de tudo o que pudesse ser interessante. 418 00:25:06,978 --> 00:25:11,074 Estes dossiers foram digitalizados 419 00:25:12,652 --> 00:25:15,692 até mais ou menos 1949 420 00:25:17,076 --> 00:25:23,123 pelo projeto financiado pelo DFG de 2004 a 2007. 421 00:25:24,268 --> 00:25:30,591 Como resultado, até agora, foram 25,000 dossiers temáticos 422 00:25:31,727 --> 00:25:33,759 desta altura. 423 00:25:34,131 --> 00:25:38,013 Isto contém perto de 2 milhões ou mais de 2 milhões de páginas. 424 00:25:38,885 --> 00:25:41,538 E estão online. 425 00:25:43,633 --> 00:25:48,461 Esta aplicação desenvolvida na altura pela ZBW, 426 00:25:50,006 --> 00:25:54,341 que agora parece um pouco ultrapassada, 427 00:25:55,031 --> 00:25:58,153 não tão bonita e que agora é mais um problema. 428 00:25:58,597 --> 00:26:04,350 É uma aplicação que foi construída arquitecturalmente em Oracle, 429 00:26:04,350 --> 00:26:08,662 construída em ColdFusion, é executada em servidores Windows, 430 00:26:09,227 --> 00:26:14,992 por isso não é muito sustentável a longo prazo. 431 00:26:16,008 --> 00:26:19,274 E discutimos se devemos migrá-la 432 00:26:19,274 --> 00:26:22,755 para uma melhor aplicação de dados 433 00:26:23,931 --> 00:26:27,964 ou se devemos dar um passo radical 434 00:26:27,964 --> 00:26:31,749 e por os dados todos em aberto. 435 00:26:32,843 --> 00:26:37,416 Atribuímos uma licença CC0 àqueles dados 436 00:26:37,416 --> 00:26:40,938 e, neste momento, estamos a mover algumas camadas... 437 00:26:42,036 --> 00:26:46,463 algumas camadas de descoberta... por isso é uma camada primária de acesso, 438 00:26:47,233 --> 00:26:50,587 para uma web de dados abertos ligada 439 00:26:51,315 --> 00:26:56,881 onde faz mais sentido 440 00:26:57,381 --> 00:27:01,298 pôr alguns metadados na Wikidata. 441 00:27:02,380 --> 00:27:07,094 E para garantir que todas as pastas 442 00:27:07,924 --> 00:27:11,183 das coleções estão ligados à Wikidata, 443 00:27:11,485 --> 00:27:13,308 para que possam ser encontradas, 444 00:27:14,240 --> 00:27:17,795 e que a metadata dessas pastas 445 00:27:18,444 --> 00:27:22,977 seja também transferida para a Wikidata. 446 00:27:23,344 --> 00:27:27,886 De forma a que seja usada aí, e que seja enriquecida lá, possivelmente. 447 00:27:28,780 --> 00:27:32,237 Podem ser feitas correções a esses dados. 448 00:27:32,645 --> 00:27:38,894 O que ainda é mantido pela ZWB é, claro, o armazenamento de imagens, 449 00:27:39,947 --> 00:27:43,882 que não podemos pôr de qualquer forma, 450 00:27:45,548 --> 00:27:47,326 ou não podemos dar a respetiva licença 451 00:27:47,326 --> 00:27:51,179 porque são propriedade dos criadores iniciais. 452 00:27:52,271 --> 00:27:54,954 Mas fazermos tudo para que sejam accessíveis 453 00:27:56,500 --> 00:28:02,203 por alguns ficheiros de metadados via DFG Viewer. 454 00:28:03,108 --> 00:28:06,108 No futuro, por manifestos de IIIF. 455 00:28:06,849 --> 00:28:11,050 E vamos preparar algumas páginas estáticas de entrada 456 00:28:11,707 --> 00:28:18,333 que vão servir de ponto de dados de referência para a Wikidata, 457 00:28:18,333 --> 00:28:22,596 bem como para colocar dados disponíveis 458 00:28:22,600 --> 00:28:26,174 que não encaixam bem na Wikidata. 459 00:28:31,253 --> 00:28:36,815 Para nós, é migração e doação de dados à Wikidata 460 00:28:37,165 --> 00:28:40,633 com a nossa infraestrutura costumizada 461 00:28:40,633 --> 00:28:44,837 de endpoint SPARQL, com esses dados, 462 00:28:45,887 --> 00:28:48,980 e que nós utilizámos com consultas federadas 463 00:28:49,990 --> 00:28:53,834 entre o endpoint e o Wikidata Query Service 464 00:28:53,834 --> 00:28:57,633 para criar declarações de acordo. 465 00:28:59,207 --> 00:29:02,107 Com [os olhos] concatenados 466 00:29:02,107 --> 00:29:06,937 em consultas de SPARQL ou transformados via script, 467 00:29:07,907 --> 00:29:12,254 que também geraram referências para as declarações. 468 00:29:12,742 --> 00:29:19,446 E depois, pô-los em QuickStatements do código para utilizar online. 469 00:29:22,544 --> 00:29:24,268 Então, isto é o que temos. 470 00:29:24,493 --> 00:29:28,669 Não são coisas simples como datas de nascimento, mas, desculpem... 471 00:29:29,835 --> 00:29:34,998 mas também declarações complexas 472 00:29:34,998 --> 00:29:39,787 sobre alguns itens já existentes, 473 00:29:39,787 --> 00:29:45,010 como esta pessoa que teve um cargo de Administração de uma dita companhia 474 00:29:46,682 --> 00:29:48,905 durante este período de tempo, 475 00:29:49,663 --> 00:29:57,169 e referênciada para ser utilizada em... 476 00:29:58,463 --> 00:30:01,864 contexto científico. 477 00:30:07,763 --> 00:30:10,939 A primeira parte desta doação de dados foi terminada. 478 00:30:12,736 --> 00:30:17,201 O Arquivo de Pessoas está completamente ligado à Wikidata. 479 00:30:18,333 --> 00:30:23,652 E esta é também uma ferramenta de informação. 480 00:30:23,652 --> 00:30:27,360 Uma boa parte dos itens que estavam aqui antes 481 00:30:27,360 --> 00:30:30,422 não tinham referências externas. 482 00:30:31,278 --> 00:30:35,674 E tínhamos mais de 6,000 declarações, 483 00:30:36,201 --> 00:30:41,924 que têm agora fontes nos metadados deste arquivo. 484 00:30:45,288 --> 00:30:49,951 Bem, esta foi a parte mais simples, 485 00:30:50,880 --> 00:30:54,785 porque pessoas são facilmente identificadas na Wikidata. 486 00:30:56,494 --> 00:30:59,984 Mais de 90% já existia por aqui, 487 00:31:00,443 --> 00:31:02,412 por isso, podíamos fazer as ligações. 488 00:31:02,412 --> 00:31:06,486 Criámos à volta de 100 itens para estes, 489 00:31:06,845 --> 00:31:09,166 para os que estavam a faltar. 490 00:31:09,296 --> 00:31:13,816 Mas agora, estamos a trabalhar 491 00:31:13,824 --> 00:31:18,165 no resto do arquivo, 492 00:31:18,165 --> 00:31:20,432 particularmente no Arquivo de Tópicos. 493 00:31:21,243 --> 00:31:24,803 Isto quer dizer mapear um sistema histórico 494 00:31:24,803 --> 00:31:29,351 acerca de todo o mundo, para a organização de conhecimento, 495 00:31:29,884 --> 00:31:34,147 materializado como manchetes de um jornal na Wikidata. 496 00:31:36,305 --> 00:31:41,898 Para vos dar uma ideia básica, o arquivo de Países e Tópicos 497 00:31:42,668 --> 00:31:48,773 está organizado por uma hierarquia de países 498 00:31:48,773 --> 00:31:50,882 e outras entidades geográficas 499 00:31:52,499 --> 00:31:56,453 que estão traduzidas para inglês, o que torna isto mais simples. 500 00:31:58,543 --> 00:32:01,861 E para alemão profundamente agrupado.. 501 00:32:03,881 --> 00:32:08,064 na classificação dos tópicos profundamente agrupados 502 00:32:08,064 --> 00:32:11,172 E esta combinação define uma... 503 00:32:13,032 --> 00:32:15,870 ...uma pasta. 504 00:32:16,289 --> 00:32:21,128 O que queremos fazer agora é mapear isto 505 00:32:21,128 --> 00:32:24,575 como estrutura para a Wikidata e trazer dados. 506 00:32:26,575 --> 00:32:29,338 Quero convidar-vos 507 00:32:29,338 --> 00:32:33,801 a juntarem-se a este desafio interessante 508 00:32:33,801 --> 00:32:36,272 em termos de organização de conhecimento. 509 00:32:37,739 --> 00:32:40,713 Este trabalho é seguido num projeto WikiProject, 510 00:32:40,713 --> 00:32:46,288 e podem segui-lo ou participar nele. 511 00:32:46,591 --> 00:32:48,908 E sim, muito obrigado. 512 00:32:49,639 --> 00:32:53,630 (Aplausos) 513 00:33:03,999 --> 00:33:07,284 Estamos a levar as artes performativas para a Wikidata. 514 00:33:07,735 --> 00:33:11,930 E estamos a levar as artes performativas à nuvem de dados aberta ligada, 515 00:33:11,930 --> 00:33:14,633 ao construir um ecossistema ligado e de dados abertos 516 00:33:14,633 --> 00:33:16,320 para as artes performativas. 517 00:33:16,320 --> 00:33:21,157 E a questão que estou a tentar responder, 518 00:33:21,157 --> 00:33:24,712 e espero que me ajudem a responder a questões 519 00:33:24,712 --> 00:33:27,006 colocadas à Wikidata e a tudo isso. 520 00:33:27,006 --> 00:33:31,433 Mas deixem-me, primeiro, começar com as minhas experiências 521 00:33:31,733 --> 00:33:34,574 que aconteceram este ano, 522 00:33:34,684 --> 00:33:37,769 no primeiro semestre do ano, quando tive o prazer 523 00:33:37,769 --> 00:33:39,335 de trabalhar para a CAPACOA, 524 00:33:39,335 --> 00:33:42,227 que é a Associação Canadiana de Artes Representativas, 525 00:33:42,227 --> 00:33:47,657 que atualmente lançou um projeto chamado Iniciativa Para o Futuro Digital Ligado, 526 00:33:47,891 --> 00:33:53,195 para conseguir que o setor inteiro de arte no Canadá abraçasse os dados ligados. 527 00:33:53,777 --> 00:33:56,972 E fizeram isso com base na observação 528 00:33:56,972 --> 00:33:59,200 que, durante os últimos cinco anos, 529 00:33:59,774 --> 00:34:03,981 a necessidade... o tópico importante dentro das artes performativas 530 00:34:03,981 --> 00:34:08,848 era o facto dos metadados não terem qualidade suficiente 531 00:34:09,136 --> 00:34:12,250 e não estarem interligados, não serem interoperacionais. 532 00:34:12,520 --> 00:34:16,532 E isso foi o porquê de algumas performances, 533 00:34:16,712 --> 00:34:19,248 alguns eventos, não serem fáceis de encontrar 534 00:34:19,248 --> 00:34:24,779 pelo Google e pelos assistentes virtuais, etc. 535 00:34:25,967 --> 00:34:29,777 Portanto, a visão que desenvolvemos juntos 536 00:34:30,053 --> 00:34:33,386 é que queremos ter uma base de dados de conhecimento 537 00:34:33,966 --> 00:34:36,079 para vários intervenientes ao mesmo tempo. 538 00:34:36,079 --> 00:34:39,735 Observámos então o valor da rede inteira de artes performativas, 539 00:34:40,053 --> 00:34:42,590 identificámos os intervenientes chave, 540 00:34:42,590 --> 00:34:45,930 observámos os cenários de utilização que queríamos investigar, 541 00:34:47,994 --> 00:34:52,019 e mapeámo-los na arquitetura global 542 00:34:52,267 --> 00:34:56,740 dessa base de dados de conhecimento, ou das diferentes plataformas, 543 00:34:57,315 --> 00:34:59,671 que é, obviamente, uma arquitetura distribuída 544 00:34:59,766 --> 00:35:01,703 e não um grande monólito. 545 00:35:02,464 --> 00:35:05,827 Vou só rever isso por alto 546 00:35:05,827 --> 00:35:08,158 porque temos dez minutos para cada. 547 00:35:09,146 --> 00:35:13,682 Mas acho que temos tempo suficiente entre hoje e amanhã para aprofundar o tema 548 00:35:13,682 --> 00:35:16,350 se houver alguém interessado nos detalhes. 549 00:35:16,350 --> 00:35:19,403 Começámos a partir da Rede de Valor das Artes Performativas, 550 00:35:19,403 --> 00:35:23,441 que, curiosamente, só foi publicada o ano passado. 551 00:35:23,441 --> 00:35:27,838 Somos uns sortudos por termos conseguido construir a partir do trabalho anterior, 552 00:35:27,838 --> 00:35:31,343 por exemplo, temos a corrente de dados de valor das artes performativas no meio, 553 00:35:31,343 --> 00:35:34,323 e os vários intervenientes à volta disso. 554 00:35:34,388 --> 00:35:37,460 No total, identificámos 20 grupos de intervenientes 555 00:35:37,835 --> 00:35:43,634 que, depois, reduzimos para sete grandes categorias 556 00:35:43,634 --> 00:35:45,668 para cada grupo de intervenientes. 557 00:35:45,668 --> 00:35:47,228 Nós como que... 558 00:35:48,948 --> 00:35:51,668 formulámos o tipo de necessidades 559 00:35:51,668 --> 00:35:54,772 que teriam nesse tipo de infraestrutura, 560 00:35:54,772 --> 00:35:58,692 e o que teriam de atingir se o todo estivesse interligado 561 00:35:58,692 --> 00:36:02,192 e os dados estivessem acessíveis publicamente. 562 00:36:03,030 --> 00:36:04,977 E assim, podem ver os tipos aqui, 563 00:36:05,187 --> 00:36:08,984 os diferentes tipos são Produção, depois Apresentação & Promoção, 564 00:36:09,274 --> 00:36:11,972 Cobertura & Reutilização, Audiências ao Vivo 565 00:36:12,152 --> 00:36:15,169 Consumo Online, Herança, Educação & Pesquisa. 566 00:36:15,959 --> 00:36:18,917 E, depois de preparar uma tabela tão grande, 567 00:36:18,917 --> 00:36:21,275 da qual só conseguem ver a primeira parte, 568 00:36:21,805 --> 00:36:25,128 comparámos e demos uma vista de olhos ao tipo de dados 569 00:36:25,128 --> 00:36:26,954 que estávamos a utilizar pelo quadro 570 00:36:26,954 --> 00:36:31,584 pelos diferentes grupos de intervenientes. 571 00:36:31,584 --> 00:36:36,773 Temos uma base de dados grande que é comum a todos eles, 572 00:36:36,773 --> 00:36:38,614 e é, na realidade, a área 573 00:36:38,614 --> 00:36:43,322 onde faz muito sentido, na verdade, cooperar e manter esses... 574 00:36:43,503 --> 00:36:46,193 ...guardar esses dados juntos. 575 00:36:47,602 --> 00:36:50,651 Então, quando falamos de arquitetura da plataforma, 576 00:36:51,099 --> 00:36:54,096 podemos ver que temos aqui 4 camadas. 577 00:36:54,096 --> 00:36:56,448 Em baixo, temos a camada dos dados. 578 00:36:56,448 --> 00:36:58,717 Claro, a Wikidata é parte disto, 579 00:36:58,717 --> 00:37:02,733 como também outras bases de dados, bases de dados distribuidas 580 00:37:02,733 --> 00:37:07,769 que podem expor dados por endpoints SPARQL. 581 00:37:09,204 --> 00:37:13,422 Na camada amarela do meio, temos a camada de semântica. 582 00:37:13,422 --> 00:37:16,080 É a nossa linguagem comum para descrever as nossas coisas, 583 00:37:16,080 --> 00:37:21,944 para fazer declarações acerca das artes performativas, da ontologia. 584 00:37:22,560 --> 00:37:25,243 Depois temos uma camada aplicacional 585 00:37:25,243 --> 00:37:30,551 que consiste em vários módulos, por exemplo, análise de dados, 586 00:37:30,551 --> 00:37:34,613 extração de dados, para que convertamos dados não estruturados 587 00:37:34,613 --> 00:37:36,029 em dados estruturados... 588 00:37:36,029 --> 00:37:39,199 como podemos apoiar isso com as ferramentas. 589 00:37:39,436 --> 00:37:42,478 Depois, obviamente, temos a visualização de dados... 590 00:37:42,828 --> 00:37:47,135 se houver grandes quantidades de dados, queremos visualizá-los de alguma forma. 591 00:37:47,801 --> 00:37:50,155 E no topo, temos a camada de apresentação, 592 00:37:50,155 --> 00:37:54,814 que é onde os utilizadores comuns estão a interagir 593 00:37:54,814 --> 00:37:56,199 numa base diária... 594 00:37:56,199 --> 00:37:59,615 motores de busca, enciclopédias, agendas culturais, 595 00:37:59,615 --> 00:38:02,317 e uma variedade de outros serviços. 596 00:38:03,395 --> 00:38:05,386 Não estamos a começar do zero. 597 00:38:05,386 --> 00:38:08,735 Algum do trabalho já foi feito nesta área. 598 00:38:09,107 --> 00:38:13,043 Vou só citar alguns exemplos de um projeto 599 00:38:13,043 --> 00:38:15,295 em que estive envolvido. 600 00:38:15,495 --> 00:38:18,149 E outras coisas a decorrer também. 601 00:38:18,559 --> 00:38:21,195 E como tal, comecei nesta área 602 00:38:21,195 --> 00:38:24,476 com o Arquivo Suíço de Artes Performativas. 603 00:38:25,001 --> 00:38:27,795 Até construir uma base de dados Suiça de Artes Performativas, 604 00:38:27,795 --> 00:38:31,046 criámos uma ontologia de artes performativas, 605 00:38:31,046 --> 00:38:33,931 que está neste momento a ser implementada em RDF. 606 00:38:35,281 --> 00:38:39,771 E temos ALI uma base de dados com quase 60, 70 anos 607 00:38:39,771 --> 00:38:43,313 de história de performances na Suiça. 608 00:38:43,313 --> 00:38:45,145 Portanto, isso é algo que pode ser construído 609 00:38:45,145 --> 00:38:48,999 e foi transformado em formato RDF. 610 00:38:49,968 --> 00:38:54,621 E havia uma plataforma onde esses dados podem ser acedidos. 611 00:38:56,303 --> 00:39:01,658 Fizemos também algumas inserções na Wikidata, 612 00:39:01,658 --> 00:39:03,166 parcialmente a partir da Suiça, 613 00:39:03,166 --> 00:39:09,296 também parcialmente a partir de institutos de artes performativas. 614 00:39:09,680 --> 00:39:12,357 Por exemplo, Bart Magnus estava envolvido nisso. 615 00:39:12,883 --> 00:39:15,078 Foi a força motriz por trás disso. 616 00:39:15,078 --> 00:39:17,223 Existem também dados de Wikimedia Commons, 617 00:39:17,223 --> 00:39:21,361 mas que não estão muito bem interligados com o resto dos nossos metadados. 618 00:39:21,671 --> 00:39:25,097 E, obviamente, ao fazer esta inserção, 619 00:39:25,097 --> 00:39:29,274 também começámos a implementar partes do modelo de dados Suíço 620 00:39:29,274 --> 00:39:31,345 na Wikidata. 621 00:39:32,767 --> 00:39:37,556 Depois, temos um dos parceiros de implementação Canadianos 622 00:39:37,556 --> 00:39:39,013 que é a Culture Creates. 623 00:39:39,013 --> 00:39:43,872 Estão a gerir uma plataforma que tira informação de websites de cinema. 624 00:39:44,362 --> 00:39:47,363 e coloca-a dentro de um gráfico de conhecimento, 625 00:39:48,293 --> 00:39:54,808 para depois a expôr a motores de busca e outros dispositivos. 626 00:39:58,265 --> 00:40:03,027 Novamente, tivemos de implementar e estender isto na ontologia. 627 00:40:03,261 --> 00:40:08,163 E, como podem ver pelo slide, existem muitos espaços em branco, 628 00:40:08,163 --> 00:40:10,038 mas também existem algumas sobreposições, 629 00:40:10,038 --> 00:40:13,442 e uma sobreposição importante, obviamente, é a linguagem partilhada comum, 630 00:40:13,456 --> 00:40:18,693 que nos vai ajudar a interligar os vários blocos de dados. 631 00:40:20,759 --> 00:40:22,587 O que é também importante, obviamente, 632 00:40:22,587 --> 00:40:26,404 é que estamos a utilizar a mesma base de registo e certificados. 633 00:40:26,406 --> 00:40:31,368 E isto é uma coisa onde a Wikidata está a ter um papel importante 634 00:40:31,368 --> 00:40:33,967 ao interligar isso. 635 00:40:34,619 --> 00:40:37,619 Agora, quero partilhar as recomendações 636 00:40:37,799 --> 00:40:42,162 do Comité de Aconselhamento para Iniciativas Futuras de Ligação de Dados. 637 00:40:43,329 --> 00:40:45,169 Pelo menos as duas primeiras recomendações. 638 00:40:45,169 --> 00:40:47,930 Então, para os Canadianos, é agora absolutamente crucial 639 00:40:48,110 --> 00:40:53,173 preencher o seu próprio gráfico canadiano de conhecimento de artes performativas, 640 00:40:53,173 --> 00:40:55,851 porque, ao contrário do Arquivo Suíço para as Artes Performativas, 641 00:40:55,851 --> 00:40:59,389 eles não estão a começar com uma base de dados pré-existente, 642 00:40:59,389 --> 00:41:01,906 mas sim a criá-la do zero. 643 00:41:01,906 --> 00:41:04,468 E é absolutamente crucial haver lá dados. 644 00:41:04,468 --> 00:41:09,024 Em segundo lugar, como podem ver, vem já a Wikidata. 645 00:41:09,024 --> 00:41:12,342 A Wikidata, pelo Comité de Aconselhamento, 646 00:41:12,342 --> 00:41:17,859 foi vista como complemento à Artsdata.ca, este gráfico de conhecimento, 647 00:41:18,347 --> 00:41:21,474 e, como tal, devem ser feitos esforços para contribuir 648 00:41:21,474 --> 00:41:24,878 para a introdução de dados relacionados com artes performativas. 649 00:41:25,813 --> 00:41:30,775 E isso é onde vamos trabalhar durante os próximos meses e anos 650 00:41:30,775 --> 00:41:34,748 e é também por isso que estou aqui também a ver 651 00:41:34,748 --> 00:41:38,644 quem se quer juntar a esse esforço. 652 00:41:40,556 --> 00:41:44,942 Por isso, agora, obviamente, estamos a dizer que se complementam. 653 00:41:44,942 --> 00:41:48,341 Temos de pensar nos prós e contras 654 00:41:48,341 --> 00:41:49,844 de cada uma das abordagens. 655 00:41:49,844 --> 00:41:52,073 Podem ver aqui uma comparação 656 00:41:52,073 --> 00:41:56,500 entre a abordagem da Wikidata e a da ligação de dados mais clássica. 657 00:41:56,887 --> 00:41:59,947 Estou disponível para discutir isso em detalhe convosco 658 00:41:59,947 --> 00:42:02,549 e saber como foram as vossas experiências com isso. 659 00:42:02,814 --> 00:42:07,727 Mas, para mim, a Wikidata tem vantagens porque é uma plataforma de crowdsourcing, 660 00:42:07,727 --> 00:42:11,671 e porque é fácil convidar mais gente para contribuir. 661 00:42:11,683 --> 00:42:17,482 Do lado negativo, obviamente, temos este problema de falta de controlo. 662 00:42:17,658 --> 00:42:22,764 Os donos dos dados têm de abrir mão dos seus gráficos, qualidade de dados, 663 00:42:22,764 --> 00:42:24,382 e do que completaram. 664 00:42:27,044 --> 00:42:31,096 É difícil fazer o rastreamento da Wikidata mesmo que esteja sob o vosso controlo. 665 00:42:31,493 --> 00:42:34,376 Outro forte da Wikidata 666 00:42:34,376 --> 00:42:39,617 é que requer integração imediata com o gráfico global. 667 00:42:39,867 --> 00:42:41,984 E vocês como que, só o fazem... 668 00:42:42,544 --> 00:42:46,768 como que reconciliam passo por passo contra outras bases de dados, 669 00:42:46,768 --> 00:42:49,528 que pode ser visto por alguns como uma vantagem, 670 00:42:49,528 --> 00:42:53,914 mas claro, se estão à procura de integração e interoperacionalidade, 671 00:42:53,914 --> 00:42:56,792 a Wikidata força-vos a fazer isso desde o inicio. 672 00:42:59,184 --> 00:43:03,157 E depois, claro, harmonizar as práticas de modelação de dados 673 00:43:03,157 --> 00:43:05,552 é uma situação em ambos os casos. 674 00:43:06,039 --> 00:43:10,671 Mas pode parecer, no inicio, mais fácil fazê-lo só no vosso silo, 675 00:43:10,671 --> 00:43:13,356 porque, a certa altura, acabarão a tarefa 676 00:43:13,356 --> 00:43:16,693 e será uma tarefa que continuará na Wikidata. 677 00:43:18,280 --> 00:43:22,883 Então, quando chegar à parte de prioritizar os dados para serem inseridos, 678 00:43:23,535 --> 00:43:28,905 é como as regras que tenho neste momento. 679 00:43:30,055 --> 00:43:32,325 Primeiro que tudo, queremos entender 680 00:43:32,325 --> 00:43:36,191 se está claro ou não quem será a autoridade em determinada área. 681 00:43:36,341 --> 00:43:40,583 Por isso esses serão dados que terão de ser geridos de forma partilhada. 682 00:43:42,712 --> 00:43:44,956 E queremos entender onde podemos ver 683 00:43:44,956 --> 00:43:47,149 um potencial elevado para abordagens crowdsourcing. 684 00:43:47,149 --> 00:43:51,693 Queremos também perceber se os dados poderão ser reutilizados 685 00:43:51,693 --> 00:43:53,965 no contexto da Wikipedia. 686 00:43:54,813 --> 00:44:00,262 E existe também a esperança que parte da coordenação internacional 687 00:44:00,262 --> 00:44:04,364 à volta de toda a modelação de dados, sobre a standarização, 688 00:44:04,364 --> 00:44:07,531 possa mesmo ser feita diretamente na Wikidata 689 00:44:07,531 --> 00:44:09,484 se não estiver a ser feita noutro local, 690 00:44:09,484 --> 00:44:12,220 porque é como que se forçasse as pessoas a começar a interagir, 691 00:44:12,650 --> 00:44:15,246 se digerirem os dados na mesma parte. 692 00:44:17,293 --> 00:44:22,361 Queremos focar-nos a seguir nos registos base e ficheiros de controlo, 693 00:44:22,361 --> 00:44:26,085 porque vão ajudar-nos a fazer as associações 694 00:44:26,085 --> 00:44:29,010 entre diferentes dados e vocabulário não controlado 695 00:44:29,010 --> 00:44:32,833 como uma extensão da ontologia já existente. 696 00:44:34,891 --> 00:44:36,480 Só mais dois slides. 697 00:44:36,480 --> 00:44:40,978 Os próximos passos vão ser levar a soma de todas as abordagens GLAM 698 00:44:40,978 --> 00:44:42,888 para a Wiki Loves Performing Arts. 699 00:44:43,098 --> 00:44:47,524 Isto significa que estamos a descrever locais e organizações, 700 00:44:47,524 --> 00:44:51,106 e a colocar os dados na Wikipédia 701 00:44:51,106 --> 00:44:54,414 em formato de infoboxes e templates de bolhas. 702 00:44:54,414 --> 00:44:59,769 E no outro slide, os outros projetos que vou seguir chamam-se COST Action 703 00:45:00,336 --> 00:45:02,001 que vamos submeter no próximo ano 704 00:45:03,120 --> 00:45:04,430 à volta do Ecosistema de Dados 705 00:45:04,430 --> 00:45:06,307 Abertos Ligados para as Artes Performativas. 706 00:45:06,307 --> 00:45:10,347 O COST é um programa europeu que apoia as actividades de redes, 707 00:45:10,347 --> 00:45:13,929 e os tópicos a serem abrangidos estão listados aqui. 708 00:45:14,549 --> 00:45:16,404 Dois deles, sublinhei-os... 709 00:45:16,924 --> 00:45:20,702 um deles é a questão federativa entre a Wikidata 710 00:45:20,702 --> 00:45:24,057 e as abordagens clássicas de dados abertos ligados. 711 00:45:24,768 --> 00:45:27,744 E a outra, penso eu, que também é muito importante, 712 00:45:27,744 --> 00:45:30,528 onde temos ainda um potencial enorme, 713 00:45:30,528 --> 00:45:35,683 é implementar campanhas internacionais para dados suplementares na Wikidata. 714 00:45:37,927 --> 00:45:41,365 E é tudo. Muito obrigado pela vossa atenção. 715 00:45:42,859 --> 00:45:47,912 Agora, queria chamar aos meus colegas aqui ao painel. 716 00:45:47,912 --> 00:45:50,529 Se calhar também lhes poderiam arranjar microfones. 717 00:45:53,903 --> 00:45:55,682 E depois queria... 718 00:45:57,473 --> 00:45:59,940 dar-vos a oportunidade de colocar questões. 719 00:46:01,042 --> 00:46:05,185 E, obviamente, perguntar aos meus colegas 720 00:46:05,753 --> 00:46:08,071 se têm questões uns para os outros. 721 00:46:12,049 --> 00:46:15,327 Então, temos se calhar, alguma questão do público? 722 00:46:20,502 --> 00:46:22,758 (plateia 2) [inaudível] 723 00:46:23,587 --> 00:46:27,033 Queria perguntar a cada um de vós 724 00:46:27,033 --> 00:46:30,842 onde colocariam limites, 725 00:46:30,842 --> 00:46:33,076 basicamente, como definem... 726 00:46:33,076 --> 00:46:35,956 quando precisam de fazer a vossa própria Wikibase 727 00:46:35,956 --> 00:46:39,328 e o que querem colocar na Wikidata? 728 00:46:39,328 --> 00:46:43,677 Por exemplo, isto é uma delimitação clara do que é visto 729 00:46:43,677 --> 00:46:45,981 por detrás do que colocam [na ordem]. 730 00:46:48,211 --> 00:46:51,484 Posso responder primeiro porque tenho o microfone. 731 00:46:52,094 --> 00:46:57,565 Tenho estado a pensar que um dos assuntos é a notariedade. 732 00:46:59,212 --> 00:47:02,084 Estou a endereçar isso num projeto diferente. 733 00:47:03,224 --> 00:47:05,898 Penso que o licenciamento é um deles, 734 00:47:05,898 --> 00:47:10,466 porque podem aplicar os vossos termos na vossa própria base de dados, 735 00:47:10,466 --> 00:47:13,758 e depois, penso, onde quer que seja possível. 736 00:47:14,284 --> 00:47:19,882 Depois, o terceiro é tê-los somente como um ensaio, 737 00:47:19,882 --> 00:47:23,078 preparando-os para tratamento na Wikidata. 738 00:47:23,078 --> 00:47:26,085 Estes são os três assuntos principais de que me lembro, para já, 739 00:47:26,085 --> 00:47:28,554 mas posso trazer-vos mais. 740 00:47:29,976 --> 00:47:32,369 Para mim, os direitos serão sempre um assunto. 741 00:47:32,849 --> 00:47:36,686 Se a Biblioteca Nacional quisesse migrar para a Wikibase, 742 00:47:36,686 --> 00:47:39,740 isso poderia habilitá-los a continuar a controlar o licenciamento 743 00:47:39,740 --> 00:47:42,539 pelo trabalho que têm feito com os termos da língua maori. 744 00:47:43,438 --> 00:47:46,483 A base de dados kakapo só contém dados 745 00:47:46,483 --> 00:47:49,977 que o Departamento de Conservação achou que deveria ser tornados públicos, 746 00:47:49,977 --> 00:47:52,739 mas suspeito que se a virem a funcionar, 747 00:47:52,739 --> 00:47:55,980 poderão tentar utilizar uma Wikibase privada 748 00:47:55,980 --> 00:47:58,128 para manter a sua própria base de dados, 749 00:47:58,128 --> 00:48:01,214 somente porque algumas das ferramentas de visualização 750 00:48:01,214 --> 00:48:03,567 que poderão ser aplicadas podem ser melhores 751 00:48:03,567 --> 00:48:07,417 que a espécie de folha de cálculo de Excel que têm actualmente. 752 00:48:12,337 --> 00:48:16,556 Bem, penso que isto depende muito do tipo de dados. 753 00:48:17,789 --> 00:48:22,359 Nós estamos, no Arquivo de Imprensa, claro, numa posição bastante sortuda, 754 00:48:22,359 --> 00:48:26,984 no sentido em que isto era material que foi publicado, 755 00:48:26,984 --> 00:48:29,829 foi publicado na altura, 756 00:48:30,153 --> 00:48:32,150 mas foi bastante dispendioso para publicar. 757 00:48:35,132 --> 00:48:36,680 Isto é muito simples. 758 00:48:36,680 --> 00:48:39,449 Penso que, também, projetos... 759 00:48:39,921 --> 00:48:42,476 e isto é um projeto típico, 760 00:48:42,476 --> 00:48:45,726 foi patrocinado por algum tempo, depois o patrocinio acabou, 761 00:48:46,466 --> 00:48:51,516 e o que aconteceu aos dados, é que foram colocados num silo, 762 00:48:52,136 --> 00:48:55,106 sobre um software que não vai correr para sempre. 763 00:48:55,846 --> 00:48:59,436 Por isso, faz sentido absoluto a meu ver. 764 00:48:59,896 --> 00:49:02,776 Na altura, a Wikidata, não estava por aqui, mas agora está, 765 00:49:03,376 --> 00:49:07,336 e faz sentido para os nossos projetos, desde cedo, 766 00:49:07,336 --> 00:49:12,732 discutir a sustentabilidade no contexto de como podemos colocar isto 767 00:49:12,732 --> 00:49:16,617 num ecossistema maior, como a Wikidata 768 00:49:18,017 --> 00:49:21,408 e discutir isto com a comunidade de dados: 769 00:49:21,408 --> 00:49:26,864 o que será importante e fará sentido ser adicionado à Wikidata, 770 00:49:26,864 --> 00:49:32,093 e o que fará sentido ser mantido numa forma proprietária. 771 00:49:32,093 --> 00:49:37,753 Se calhar numa forma mais simples do que numa aplicação sofisticada, 772 00:49:37,753 --> 00:49:43,055 mas estando disponível e ligado à nuvem de dados maior 773 00:49:43,055 --> 00:49:46,032 ao invés de investirem muito dinheiro 774 00:49:46,032 --> 00:49:53,292 num qualquer silo que não é sustentável. 775 00:49:55,201 --> 00:50:00,121 Sim, como disse antes no projeto que apresentei aqui, 776 00:50:00,121 --> 00:50:02,206 existem dualidades entre a Wikidata 777 00:50:02,206 --> 00:50:04,926 e as abordagens clássicas de dados abertos ligados. 778 00:50:04,926 --> 00:50:08,198 Por isso, não é tanto acerca de como configurar uma Wikibase privada. 779 00:50:11,147 --> 00:50:14,504 É como um desafio que tivemos e, claro, na Wikidata 780 00:50:14,504 --> 00:50:17,710 é que, quando tratamos os nossos próprios dados lá, 781 00:50:17,710 --> 00:50:20,341 também temos de fazer alguma manutenção 782 00:50:20,744 --> 00:50:23,509 de pessoas, de outras pessoas, na realidade. 783 00:50:24,043 --> 00:50:28,258 Isso pode desencorajar as pessoas. Também quer dizer que nós trataremos disso 784 00:50:28,258 --> 00:50:29,888 passo a passo. 785 00:50:30,375 --> 00:50:33,466 Por isso, existirá, no momento, uma base de dados a viver... 786 00:50:33,873 --> 00:50:35,581 de dados abertos ligados de forma clássica. 787 00:50:35,581 --> 00:50:38,395 Nós estamos a começar a ligá-los à Wikidata 788 00:50:38,395 --> 00:50:40,993 e é um processo contínuo para encontrar 789 00:50:41,805 --> 00:50:47,643 quais as áreas em que os dados principais ficarão na Wikidata, 790 00:50:48,168 --> 00:50:51,946 e em que áreas ficarão realmente noutras bases de dados. 791 00:50:52,620 --> 00:50:56,645 Obviamente, teremos desafios em relação à sincronização, 792 00:50:57,135 --> 00:50:58,589 como todos temos, 793 00:50:58,589 --> 00:51:01,507 porque esse campo de dados ligados, 794 00:51:01,507 --> 00:51:04,826 onde ainda temos de negociar em quem confiamos, 795 00:51:05,160 --> 00:51:08,720 ou quem tem a autoridade sobre o quê. 796 00:51:13,830 --> 00:51:15,820 (assistente) Mais questões? 797 00:51:23,981 --> 00:51:25,550 (plateia 3) Obrigada. 798 00:51:28,050 --> 00:51:32,190 Concordo plenamente nesse assunto de... 799 00:51:33,275 --> 00:51:36,630 onde colocar essa fronteira 800 00:51:36,630 --> 00:51:41,599 entre o porquê de pomos dados na Wikidata, 801 00:51:43,044 --> 00:51:49,144 ou porquê ficarmos com eles, e criá-los, geri-los e mantê-los 802 00:51:49,144 --> 00:51:53,104 em bases de dados locais e com que propósitos. 803 00:51:53,778 --> 00:51:57,213 E penso que isso é uma grande discussão 804 00:51:57,213 --> 00:52:02,383 que vai para além da excitação 805 00:52:02,383 --> 00:52:07,423 de colocar dados na Wikidata porque é público, 806 00:52:07,432 --> 00:52:10,762 porque serve a humanidade, porque... 807 00:52:11,031 --> 00:52:13,362 enquanto existem duas ferramentas fixes. 808 00:52:13,362 --> 00:52:18,132 E as coisas são mais complicadas na vida real, penso eu. 809 00:52:19,162 --> 00:52:24,102 Bem, fora isso, é uma discussão interessante. 810 00:52:24,435 --> 00:52:29,744 E depois, isto é outra situação, ou outro problema que está a ser discutido 811 00:52:29,744 --> 00:52:35,479 neste evento, em diferentes painéis. 812 00:52:35,775 --> 00:52:41,129 Por um lado, temos a nossa base de dados, 813 00:52:41,129 --> 00:52:43,194 qualquer que seja a tecnologia, 814 00:52:43,194 --> 00:52:46,763 e publicamos coisas na Wikidata, 815 00:52:47,233 --> 00:52:51,166 ou criamos o nosso sistema 816 00:52:51,166 --> 00:52:55,246 de criação e gestão de informação 817 00:52:55,246 --> 00:52:58,131 com a tecnologia Wikibase. 818 00:52:58,591 --> 00:53:04,281 E depois, sincronizamos ou assim... unimos ou outra coisa. 819 00:53:04,281 --> 00:53:08,314 Por isso, é uma questão de tecnologia que é utilizada, 820 00:53:09,182 --> 00:53:14,796 e do facto de usarmos a Wikidata apenas para publicar, 821 00:53:14,978 --> 00:53:18,637 ou a infraestrutura que está por baixo da Wikidata, 822 00:53:18,637 --> 00:53:23,002 para criar e gerir os vossos dados. 823 00:53:27,116 --> 00:53:30,914 Quer dizer, tivemos uma discussão 824 00:53:30,914 --> 00:53:34,254 sobre o painel da Wikibase 825 00:53:34,254 --> 00:53:36,912 e haverá outras discussões aqui, 826 00:53:36,912 --> 00:53:40,815 mas as coisas estão em níveis diferentes, penso eu. 827 00:53:41,626 --> 00:53:47,756 Talvez [tenham] para essa discussão sobre a Wikibase ou Wikidata... 828 00:53:48,930 --> 00:53:52,427 Penso ser problemático estarmos a focar-nos tanto 829 00:53:52,427 --> 00:53:56,158 nesta infraestrutura da Wikibase, porque existem outras infraestruturas, 830 00:53:56,158 --> 00:53:58,690 como na área das artes performativas. 831 00:53:59,810 --> 00:54:04,054 Temos outra comunidade complementar que é a MusicBrainz 832 00:54:04,054 --> 00:54:08,954 que tem a sua própria plataforma que disponibiliza dados abertos ligados. 833 00:54:09,614 --> 00:54:12,692 E, de acordo com o que percebi, 834 00:54:14,160 --> 00:54:17,232 existe acordo, entre a comunidade Wikidata, 835 00:54:17,232 --> 00:54:19,731 de como não duplicaremos os seus dados... 836 00:54:19,731 --> 00:54:24,237 Não copiaremos todos os seus dados, mas aceitamos que se complementam. 837 00:54:24,848 --> 00:54:29,678 O que irá acontecer quando começarmos a integrar esses dados na Wikipédia? 838 00:54:30,246 --> 00:54:31,907 Caixas de informação, por exemplo. 839 00:54:31,907 --> 00:54:34,775 Será que vamos ser capazes de puxar esses dados directamente 840 00:54:34,775 --> 00:54:36,384 do seu endpoint SPARQL? 841 00:54:36,724 --> 00:54:39,603 Ou vamos ser obrigados a, como que copiar todos os dados, 842 00:54:39,603 --> 00:54:42,225 e que tipo de processos estarão envolvidos nisso? 843 00:54:42,225 --> 00:54:45,172 (plateia 3) As discussões estão abertas, penso eu, 844 00:54:45,172 --> 00:54:49,615 porque, neste evento, temos ambas as comunidades interessadas... 845 00:54:49,615 --> 00:54:51,975 os interessados na Wikibase, 846 00:54:51,975 --> 00:54:54,002 os que estão interessados na Wikidata, 847 00:54:54,002 --> 00:54:56,282 e os que estão interessados em ambos. 848 00:54:56,282 --> 00:54:59,562 Sim, mas não vamos obrigá-los a migrar para a Wikibase. 849 00:55:00,162 --> 00:55:03,138 - (plateia 3) Não necessariamente. - A MusicBrainz não corre na Wikibase. 850 00:55:03,138 --> 00:55:06,802 (plateia 3) Não, só queria dizer que temos problemas separados, 851 00:55:06,802 --> 00:55:10,964 por vezes relacionados, por vezes não separados completamente. 852 00:55:12,479 --> 00:55:16,573 E tenho outra questão ou reparo 853 00:55:16,573 --> 00:55:22,013 acerca da gestão de hierarquias em vocabulários controlados, 854 00:55:22,013 --> 00:55:26,473 como thesaurus, ou como você no Finto. 855 00:55:27,703 --> 00:55:30,563 Tem os locais 856 00:55:33,613 --> 00:55:40,391 nos Cabeçalhos de Assuntos Maori. 857 00:55:40,432 --> 00:55:44,212 Bem, eles têm de lidar com... 858 00:55:45,034 --> 00:55:48,139 a gestão de conceitos na hierarquia. 859 00:55:48,164 --> 00:55:51,647 Qual é o seu parecer, a sua opinião, 860 00:55:51,958 --> 00:55:55,221 sobre a possibilidade de gerir 861 00:55:55,221 --> 00:55:58,990 estes sistemas controlados 862 00:55:58,990 --> 00:56:02,292 de organização de conhecimento na Wikidata? 863 00:56:07,116 --> 00:56:10,864 Penso que no caso do Finto e locais YSO, 864 00:56:13,036 --> 00:56:18,438 o repositório será uma coleção de várias fontes, eventualmente. 865 00:56:18,978 --> 00:56:21,561 Por isso, está fluído, de qualquer forma. 866 00:56:22,026 --> 00:56:24,598 Não temos de necessariamente... 867 00:56:24,598 --> 00:56:28,305 bem, eu não represento a Biblioteca Nacional, 868 00:56:28,305 --> 00:56:31,149 mas nesse possível projeto, 869 00:56:31,699 --> 00:56:35,461 não teríamos de manter uma existente... 870 00:56:35,461 --> 00:56:38,230 ou lutar com uma estrutura existente. 871 00:56:38,580 --> 00:56:40,180 Por isso, nesse sentido, 872 00:56:40,329 --> 00:56:42,478 é uma... 873 00:56:42,478 --> 00:56:45,460 uma área aberta a exploração. 874 00:56:48,912 --> 00:56:52,402 Os Cabeçalhos de Assuntos Maori têm tendência a colocarem-se idealmente 875 00:56:52,402 --> 00:56:56,658 na estrutura Wikidata, mas o licenciamento, claro, proibe isso. 876 00:56:56,961 --> 00:56:59,491 Suspeito que, se o licenciamento fosse diferente 877 00:56:59,491 --> 00:57:01,511 e fossem postos na Wikidata, 878 00:57:01,511 --> 00:57:04,562 assim que alguém decidisse que não gostava da hierarquia 879 00:57:04,562 --> 00:57:06,162 e começasse a alterar coisas, 880 00:57:06,162 --> 00:57:10,331 haveria imediatamente uma reclamação das pessoas que trabalharam arduamente 881 00:57:10,771 --> 00:57:12,612 para criar essa estrutura 882 00:57:12,612 --> 00:57:15,641 e ter o consentimento dos diferentes Maori 883 00:57:15,641 --> 00:57:17,942 que estão na hierarquia corrente. 884 00:57:18,382 --> 00:57:21,151 Por isso, é um assunto a experimentar e resolver. 885 00:57:23,812 --> 00:57:26,502 Penso que, em termos de sistemas de organização de conhecimento, 886 00:57:26,502 --> 00:57:28,116 são todos diferentes. 887 00:57:28,116 --> 00:57:31,752 E não tenho a certeza se seria uma boa ideia 888 00:57:31,752 --> 00:57:37,226 representar diferentes hierarquias na Wikidata como tal, 889 00:57:37,650 --> 00:57:42,850 mas talvez faça sentido pensar em sobreposições 890 00:57:42,850 --> 00:57:45,431 de dados. 891 00:57:45,721 --> 00:57:48,191 Para fazer mapeamentos ao nível de conteúdo. 892 00:57:49,371 --> 00:57:54,301 Por exemplo, como a parceria ZBW Thesaurus para a Economia. 893 00:57:55,950 --> 00:57:59,360 Este dicionário tem a sua própria hierarquia, 894 00:57:59,680 --> 00:58:04,270 e, claro, seria possível projectar a hierarquia 895 00:58:04,461 --> 00:58:08,452 desse dicionário nos conceitos da Wikidata 896 00:58:08,452 --> 00:58:11,541 sem armazenar este tipo de estrutura 897 00:58:12,180 --> 00:58:14,840 como uma estrutura alternativa dentro da Wikidata, 898 00:58:14,840 --> 00:58:18,481 o que faria uma confusão tremenda. 899 00:58:19,111 --> 00:58:24,789 Penso que devíamos pensar da Wikidata, também, como uma lista de conceitos 900 00:58:24,789 --> 00:58:29,651 que podem ser ligados em camadas que estão no exterior, 901 00:58:30,264 --> 00:58:33,049 e que dão outra visão do mundo, 902 00:58:33,489 --> 00:58:39,080 que não precisa de estar necessariamente dentro da Wikidata. 903 00:58:45,775 --> 00:58:48,203 (assistente) Certo. Mais alguma questão? 904 00:58:49,096 --> 00:58:51,527 Ou então... Sim. 905 00:58:54,769 --> 00:58:57,781 (plateia 4) Joachim, queria só dar seguimento ao último ponto. 906 00:58:58,331 --> 00:59:01,764 Essas camadas, como imaginadas por si, 907 00:59:02,196 --> 00:59:07,354 seriam mantidas externamente e de alguma forma integradas 908 00:59:08,964 --> 00:59:11,764 com a Wikidata, a partir do lado da Wikidata, 909 00:59:11,764 --> 00:59:17,143 ou pensou um pouco mais 910 00:59:17,143 --> 00:59:19,463 sobre como isso poderia ser gerido? 911 00:59:22,351 --> 00:59:24,931 Por acaso, não, não pensei... 912 00:59:25,271 --> 00:59:30,361 Fiz experiências com a ZBW e a Wikidata. 913 00:59:30,771 --> 00:59:32,872 Estava preso aqui à Wikidata. 914 00:59:33,252 --> 00:59:38,837 Mas penso que isto é uma coisa completamente nova e complexa 915 00:59:39,261 --> 00:59:46,210 e, como tal, aberta a discussão para conseguir concordância 916 00:59:46,409 --> 00:59:47,908 de fazer essas coisas. 917 00:59:48,528 --> 00:59:50,798 Mas terá de ser visto. 918 00:59:56,638 --> 00:59:57,959 Podemos ouvir mais uma? 919 00:59:59,686 --> 01:00:02,628 (plateia 5) Estava a pensar no projeto kakapo. 920 01:00:03,875 --> 01:00:05,000 (apresentador anuí) 921 01:00:05,000 --> 01:00:10,805 (plateia 5) Teve algum contratempo da comunidade Wikidata 922 01:00:10,805 --> 01:00:14,636 sobre ter animais reais fora desses itens? 923 01:00:15,576 --> 01:00:16,836 Não até agora. 924 01:00:16,836 --> 01:00:19,045 (plateia 5) Alguém ouviu isto antes? 925 01:00:19,045 --> 01:00:22,445 Foi "não até agora" porque ninguém ouviu isto até agora? 926 01:00:23,085 --> 01:00:26,095 Existe uma pequena discussão, há já algum tempo... 927 01:00:26,095 --> 01:00:29,235 as pessoas interessadas neste tipo de coisas na Wikidata. 928 01:00:29,235 --> 01:00:32,215 E parece que todos pensamos que isso é uma extensão natural, 929 01:00:32,215 --> 01:00:35,855 de ter itens individuais da Wikidata, até um cavalo de corrida famoso 930 01:00:35,855 --> 01:00:39,755 ou o gato de alguém, que... está bastante bem modelado. 931 01:00:39,764 --> 01:00:44,444 Imagino que a coisa audaciosa é pôr uma espécie inteira lá. 932 01:00:44,444 --> 01:00:48,113 Mas penso que seja perfeitamente fazível. 933 01:00:48,113 --> 01:00:50,173 (plateia 5) Não tentem com gatos e cães. 934 01:00:50,173 --> 01:00:52,457 (risos) 935 01:00:52,457 --> 01:00:54,622 (assistente) Penso que o nosso tempo chegou ao fim. 936 01:00:54,622 --> 01:00:56,396 Muito obrigado por terem participado. 937 01:00:56,396 --> 01:00:59,029 Penso que os participantes ainda estarão disponíveis para questões 938 01:00:59,029 --> 01:01:00,217 e para uma pausa. 939 01:01:00,217 --> 01:01:02,202 - Divirtam-se. - Muito obrigado. 940 01:01:02,202 --> 01:01:05,032 (aplausos)