-
Title:
Algorithms Requiring Rescaling Solution - Intro to Machine Learning
-
Description:
-
O que você acha, Katie?
-
Quais respostas estão corretas aqui?
-
>> As respostas corretas, aquelas que precisam de recursos rescaled serão
-
SVM e K-MEANS CLUSTERING.
-
>> Então tanto nas máquinas de vetor de suporte quanto no agrupamento k-means, você
-
troca uma dimensão pela outra quando calcula a distância.
-
Vamos usar, por exemplo, máquinas de vetor de suporte.
-
Você vê a linha de separação que aumenta a distância.
-
Nela você calcula a distância.
-
E esse cálculo de distância compensa uma dimensão com a outra.
-
Criamos uma dimensão duas vezes maior que a outra, contada duas vezes.
-
O mesmo ocorre, coincidentemente, para
-
agrupamento K-MEANS, no qual você tem um centro do cluster.
-
E você calcula a distância do centro do cluster para todos os pontos de dados.
-
E essa distância tem exatamente a mesma caracterização.
-
Se você criar uma variável duas vezes maior, ela vai exigir o dobro.
-
Assim, as máquinas de vetor de suporte e o
-
K-MEANS são afetados pelo redimensionamento de recurso.
-
Katie, me fale sobre as árvores de decisão e a regressão linear.
-
Por que elas não estão incluídas?
-
As árvores de decisão não vão fornecer uma linha diagonal como essa, certo?
-
Elas vão fornecer uma série de linhas verticais e horizontais.
-
Então não há compensação.
-
Basta fazer um corte em uma direção e um corte em outra.
-
Você não precisa se preocupar com o que está acontecendo em uma dimensão
-
quando está fazendo algo em outra.
-
>> E se você comprimir esta pequena área aqui, para metade do tamanho,
-
porque redimensiona o recurso onde a linha da imagem está?
-
Ela ficará em um local diferente, mas
-
a separação é cronologicamente igual à anterior.
-
Ela pode ser expandida,
-
não há compensação entre essas duas variáveis diferentes.
-
E quanto à regressão linear?
-
>> Algo semelhante acontece na regressão linear.
-
Lembre-se de que na regressão linear,
-
cada um de nossos recursos vai ter um coeficiente associado a ele.
-
E esse coeficiente e esse recurso sempre ficam juntos.
-
O que acontece no recurso A não afeta o
-
coeficiente no recurso B.
-
Então, eles estão separados da mesma forma.
-
>> Na verdade, se você dobrou a escala variável de uma variável específica,
-
esse recurso ficará com metade do tamanho.
-
E a saída será exatamente igual à anterior.
-
É muito interessante ver, e para alguns algoritmos,
-
o redimensionamento realmente tem potencial se pudermos usá-lo, para outros não faz diferença.