Noam Chomsky is a philosopher and a linguist,
and in his seminal 1955 work "Syntactic Structures,"
he suggests that utterances have rules, syntactic rules,
and they're governed by formal grammars.
The problem with the wrote, wrote, wrote, de, de, de bag of words above
is that they don't form a grammatical sentence.
We much prefer grammatical sentences.
It's easier to interpret them and figure out what they mean.
We can write down these formal grammars
using a special notation.
Here these 5 lines together
are my formal grammar, and each one
is what is known as a rewrite rule.
The words that I've written in blue are called non-terminals.
If you have one of these things written in blue,
you can rewrite it with whatever is to the right of the arrow.
These words that I've written in black never occur on the left
of any one of our rewrite rules, so they can never be replaced.
Once you get there, you're stuck, and the process terminates.
We call them terminals.
Using these rules, if I start with sentence,
I can rewrite sentence to be subject verb,
and then I could rewrite that by picking any one of the rules
that has subject on the left.
Let's pick students.
I've only replaced subject, leaving this verb non-terminal alone.
But then I could replace verb with any one of these rules,
and at this point I think we're done.
The process terminates because I can't replace students or think
with anything, so here I've used 1, 2, 3, rewrite rules
to start from sentence and end up with a valid utterance.
This sort of maneuver with all these arrows is sometimes called
a derivation because I was able to derive
"students think" starting from sentence using these rewrite rules.
Even using this relatively simple grammar, however,
I have a few options.
Here I've shown another derivation starting with sentence.
Sentence goes to subject verb, verb goes to write,
subject goes to teachers, and I've produced another string
in the language of the grammar.
Both "students think" and also "teachers write"
can be produced by that grammar.
言語学者であるノーム・チョムスキーは
彼の著書である「Syntactic Structures」の中で
文には構文規則がありそれらは形式文法により
支配されていると言っています
先ほどの例で使用した支離滅裂な文は
文法的に正しい文ではありませんでした
私たちは文法的に正しい文であれば
その文を理解することができます
特別な表記法を使い
形式文法の記載ができます
ここに書いた5行は
形式文法であり
それぞれが書き換え規則と呼ばれています
青字で書かれた単語は非終端記号と呼ばれ
青字に該当するものが1つあれば
黒字で書かれた単語は何にでも置き換えられます
黒字の単語は青字の書き換え規則が
適用できないので
置き換えることはできません
黒字にたどり着いたらそこで終了です
この部分は終端記号と呼ばれています
このルールを使い文を作るとします
SentenceはSubjectとVerbに置き換えることができ
Subjectの規則どれか1つを選び
置き換えることができます
Studentsを選びましょう
Subjectを置き換えたので
Verbは非終端記号のままです
Verbを持つルールから置き換えをしましょう
これで終了ですね
Studentsとthinkは置き換えることができません
今私は1つ、2つ、3つの書き換え規則を
有効な文を持つ文にするために使用しました
今のように矢印を使っていく手順は
導出と呼ばれています
なぜなら今お見せしたように
書き換え規則を使いStudents thinkという
文を導出させたからです
このような単純な文法を使っても
いくつかの選択肢があります
ここにSentenceから始まる導出を
もう1つ書きました
SentenceはSubjectとVerbを持ちVerbはwriteを選び
SubjectはTeachersに置き換え言語の文法に従い
文を作りました
Students thinkとTeachers writeは
この文法を使い作ることができる文です
Noam Chomsky foi um filósofo e linguista,
e em seu trabalho seminal de 1955 -- Syntactic Structures --
ele sugeriu que sentenças têm regras sintáticas
e elas são governadas por gramáticas formais.
O problema com a coleção e paravras "wrote wrote wrote de de de" acima
é que elas não formam uma sentença gramatical.
É claro que preferimos sentenças gramaticais --
é mais fácil interpretá-las e entender seu significado.
Podemos escrever gramáticas formais
usando uma notação especial.
Essas 5 linhas aqui, juntas,
constituem uma gramática formal e, cada uma
é o que chamamos de regra de reescrita.
As palavras que escrevi em azul são chamadas não terminais.
Se você tem um desses não terminais em azul,
pode reescrevê-lo como o que está do lado direito da seta.
Essas palavras escritas em preto nunca ocorrem à esquerda
de nenhuma regra e, portanto, nunca podem ser substituídas.
Uma vez que você chega lá, o processo termina --
elas são chamadas terminais.
Usando essas regras, se eu começo com sentence,
posso reescrever sentence como subject verb,
e então eu poderia reescrever isso pegando uma das regras
que tem subject à esquerda.
Vamos pegar "students".
Eu apenas substitui subject, deixando este ainda este não terminal verb.
Mas então eu posso substituir verb por meio de uma dessas regras,
e nesse ponto terminamos.
O processo termina porque não podemos substituir "students" nem "think"
por nenhuma outra coisa. Então, eu usei 1, 2, 3 regras de reescrita,
para começar de sentence e terminar com uma sentená válida.
Esse tipo de processo é algumas vezes chamado de
uma derivação, porque nos possibilita derivar
"students think", começando a partir de sentence, usando essas regras de reescrita.
Mesmo com uma gramática relativamente simples,
temos algumas opções.
Aqui está outra derivação começando com sentence.
sentence -> subject verb; verb -> "write";
subject -> "teachers" -- e eu produzi outro string
na linguagem da gramática.
Tanto "students think" como "teachers write"
podem ser produzidos por esta gramática.