< Return to Video

Chatbots e os Grandes Modelos de Linguagem - Parte 2

  • 0:03 - 0:07
    [INTELIGÊNCIA ARTIFICIAL - CHATBOTS & GRANDES MODELOS DE LINGUAGEM]
  • 0:07 - 0:08
    O problema no último exemplo
  • 0:08 - 0:11
    é que a qualquer momento a IA considera
  • 0:11 - 0:16
    somente uma única letra para escolher o que vem em seguida.
  • 0:16 - 0:21
    Isso não é contexto suficiente, e então a saída não é útil.
  • 0:21 - 0:23
    E se pudéssemos treiná-la para considerar
  • 0:23 - 0:27
    um sequência de letras, tipo frases ou parágrafos,
  • 0:27 - 0:30
    para dá-la mais contexto para escolher a próxima?
  • 0:30 - 0:33
    Para isso, não utilizamos uma simples tabela de probabilidades,
  • 0:33 - 0:36
    usamos uma rede neural.
  • 0:36 - 0:38
    Uma rede neural é um sistema computacional
  • 0:38 - 0:41
    levemente inspirado nos neurônios de um cérebro.
  • 0:41 - 0:43
    Ela é treinada em um conjunto de informações,
  • 0:43 - 0:46
    e com treinamento suficiente,
  • 0:46 - 0:49
    pode aprender a receber novas informações
  • 0:49 - 0:51
    e responder respostas simples.
  • 0:51 - 0:53
    As respostas sempre incluem probabilidades
  • 0:53 - 0:56
    porque pode haver inúmeras opções.
  • 0:57 - 1:00
    Agora, vamos pegar a rede neural e treiná-la
  • 1:00 - 1:04
    em todas as sequências de letras das peças de Shakespeare
  • 1:04 - 1:07
    para aprender qual letra é mais provável
  • 1:07 - 1:09
    de ser a próxima em qualquer momento.
  • 1:11 - 1:15
    Uma vez que fizemos isso, a rede neural pode pegar qualquer sequência nova
  • 1:15 - 1:18
    e predizer qual seria uma boa letra para ser a próxima.
  • 1:18 - 1:21
    Algumas vezes a resposta é óbvia, mas geralmente não é.
  • 1:22 - 1:24
    Acontece que esta nova abordagem
  • 1:24 - 1:27
    funciona melhor, muito melhor,
  • 1:27 - 1:29
    ao olhar uma sequencia longa o suficiente de letras,
  • 1:29 - 1:33
    a IA consegue aprender padrões complexos,
  • 1:33 - 1:36
    e utiliza esses padrões para produzir textos inéditos.
  • 1:36 - 1:39
    Começa do mesmo jeito, com uma letra inicial
  • 1:39 - 1:41
    e então usa as probabilidades
  • 1:41 - 1:45
    para escolher a próxima letra e assim por diante.
  • 1:45 - 1:47
    Só que desta vez as probabilidades são baseadas
  • 1:47 - 1:51
    no contexto inteiro do que veio antes.
  • 1:52 - 1:56
    Como pode perceber, isso funciona surpreendentemente bem.
  • 1:56 - 1:58
    Agora, um sistema como o ChatGPT
  • 1:58 - 2:00
    usa uma abordagem similar,
  • 2:00 - 2:04
    mas com três adições muito importantes.
  • 2:04 - 2:07
    Primeiro, em vez de apenas treinar em Shakespeare,
  • 2:07 - 2:08
    ela olha para todas as informações
  • 2:08 - 2:11
    que consegue encontrar na internet,
  • 2:11 - 2:13
    incluindo todos os artigos da Wikipedia
  • 2:13 - 2:15
    ou todos os códigos no GitHub.
  • 2:15 - 2:18
    Segundo, em vez de aprender e predizer letras,
  • 2:18 - 2:22
    apenas as 26 letras do alfabeto,
  • 2:22 - 2:24
    ela olha para os tokens,
  • 2:24 - 2:26
    os quais são palavras inteiras,
  • 2:26 - 2:31
    partes de palavras, ou até códigos.
  • 2:31 - 2:36
    E terceira diferença é que um sistema desta complexidade
  • 2:36 - 2:38
    precisa de vários aperfeiçoamentos humanos
  • 2:38 - 2:41
    para garantir que produzirá resultados satisfatórios
  • 2:41 - 2:46
    em diversas situações, enquanto protege contra problemas
  • 2:46 - 2:51
    como produzir conteúdos altamente enviesados ou até mesmo perigosos.
  • 2:51 - 2:53
    Mesmo depois deste aperfeiçoamento,
  • 2:53 - 2:56
    é importante ressaltar que este sistema ainda está usando
  • 2:56 - 2:59
    somente probabilidades randômicas para escolher as palavras.
  • 3:00 - 3:02
    Um grande modelo de linguagem pode produzir
  • 3:02 - 3:06
    resultados inacreditáveis que parecem mágica.
  • 3:06 - 3:08
    Mas pelo fato de não ser realmente mágica,
  • 3:08 - 3:11
    ela pode muitas vezes entender as coisas errado.
  • 3:11 - 3:13
    E quando ela entende errado, as pessoas perguntam:
  • 3:13 - 3:17
    "Um grande modelo de linguagem realmente possui inteligência?"
  • 3:18 - 3:21
    Discussões sobre IA frequentemente incitam
  • 3:21 - 3:23
    debates filosóficos sobre o significado de inteligência.
  • 3:24 - 3:26
    Alguns argumentam que uma rede neural
  • 3:26 - 3:29
    que produz palavras utilizando probabilidades
  • 3:29 - 3:31
    não possui realmente inteligência.
  • 3:32 - 3:35
    Mas o que não se debate é que grandes modelos de linguagem
  • 3:35 - 3:38
    produzem resultados incríveis
  • 3:38 - 3:40
    com aplicabilidade em diversos campos.
  • 3:41 - 3:44
    Essa tecnologia já está sendo usada para criar
  • 3:44 - 3:48
    apps e sites, filmes e videogames,
  • 3:48 - 3:51
    e até mesmo para descobrir novos medicamentos.
  • 3:51 - 3:55
    A rápida aceleração da IA terá impactos enormes na sociedade,
  • 3:55 - 4:00
    e é importante para todos nós entendermos essa tecnologia.
  • 4:00 - 4:02
    O que estou mais ansiosa é para ver
  • 4:02 - 4:05
    são as coisas incríveis que as pessoas criarão com a IA.
  • 4:05 - 4:07
    E eu espero que você mergulhe de cabeça
  • 4:07 - 4:09
    para aprender mais sobre como a IA funciona
  • 4:09 - 4:11
    e explore o que você pode criar com ela.
Title:
Chatbots e os Grandes Modelos de Linguagem - Parte 2
Description:

Comece a aprender com a Code.org hoje!

Entre em contato conosco nas redes sociais:
• Twitter: https://twitter.com/codeorg
• Facebook: https://www.facebook.com/Code.org
• Instagram: https://instagram.com/codeorg
• TikTok: https://tiktok.com/@code.org
• LinkedIn: https://www.linkedin.com/company/code-org
• Medium: https://medium.com/@codeorg

Ajude a tornar nosso trabalho possível com uma doação em http://code.org/donate!

more » « less
Video Language:
English
Team:
Code.org
Project:
How AI Works
Duration:
04:16

Portuguese, Brazilian subtitles

Revisions Compare revisions