In summary, we had four different major blocks of techniques.
>> You start with the data set or the question that inspires you.
You try to extract the information from it, in the form of, of features.
You feed those features into a machine learning algorithm,
this is the heart of machine learning.
And then you evaluate that entire process to see how good you've done.
One of the hardest things is actually coming with the data set or
the question that interests you.
So one example that I loved was the Enron data set.
For you, this will be something different.
>> We spent a lot of time in class on features, how to present features, how to
get rid of features, how to find new feature spaces that actually work better,
and you can apply these techniques to pretty much any data set to get
really reasonable feature sets.
The heart and soul of this class were the algorithms which is
where the most fun is in machine learning.
You know that they are supervised if you have labels,
unsupervised if you don't have labels.
There are actually more classes in machine learning that you can talk about, but
for the sake of this class, this is what we taught you.
And really important is each algorithm needs to be tuned.
We talked about quite a bit how to tune your algorithms.
>> Last but not least will be the evaluation.
How well are you doing?
There's different types of evaluation metrics that you can use.
Depends on, depending on what's most important to you.
And at this point, once you've worked your way through from beginning to end,
the evaluation metric will tell you if you want to go back and
revisit any of these steps.
Or if you're happy with your results and you're ready to move on.
>> And the cool thing is this is the entire class on one slide.
Isn't that amazing?
.وللإيجاز، لدينا أربع مجموعات أساسية مختلفة من الأساليب
.>> حيث تبدؤون بمجموعة البيانات أو السؤال الذي يلهمكم
.وتحاولون استخراج المعلومات منه في صورة ميزات
،وتعملون على تغذية خوارزمية التعلم الآلي بتلك الميزات
.وهذا هو أساس عملية التعلم الآلي
.ثم تقيمون العملية بأكملها لملاحظة مدى جودة ما نفذتموه
ويرتبط أحد أكثر الأشياء صعوبة بمجموعة البيانات أو
.السؤال الذي يثيركم
.وأحد الأمثلة التي أحبها هو مجموعة بيانات Enron
.بالنسبة لكم، سيكون هذا شيئًا مختلفًا
>> عندما نقضي الكثير من الوقت في الدرس نتحدث عن الميزات وطريقة عرضها وكيفية
،التخلص منها وكيفية العثور على مساحات جديدة لها تعمل بطريقة أفضل
يمكنكم تطبيق تلك الأساليب بطريقة أكبر على أي مجموعة بيانات للحصول
.على مجموعات ميزات مناسبة بحق
ويتمثل أساس هذا الدرس في الخوارزميات التي
.تعد الشيء الأكثر مرحًا في التعلم الآلي
،وكما تعلمون أنها تكون خاضعة للإشراف إن كان لها تسميات
.وغير خاضعة للإشراف إن لم يكن لها تسميات
هناك دروس أخرى كثيرة في التعلم الآلي يمكنكم التحدث بشأنها، ولكن
.للوفاء بغرض هذا الدرس، سنكتفي بهذا القدر الذي علمناكم إياه
.ومن المهم للغاية ضبط كل خوارزمية جيدًا
.لقد تحدثنا قليلاً عن ضبط الخوارزميات
.>> وأخيرًا وليس آخرًا، سنتحدث عن التقييم
ما مدى جودة ما تفعلون؟
هناك أنواع مختلفة من قياسات التقييم يمكنكم استخدامها
.اعتمادًا على الأكثر أهمية بالنسبة لكم
،وعند هذه النقطة، وبمجرد أن تتبعوا سبيلكم من البداية للنهاية
سيطلعكم قياس التقييم على ما إذا كنت تريدون العودة
،وإعادة أي خطوة من تلك الخطوات مرة أخرى
.أو إذا كنتم سعداء بالنتائج التي حققتموها وجاهزون للاستمرار
.>> والشيء الرائع هو أن الدرس بأكمله في شريحة واحدة
أليس هذا أمرًا مثيرًا؟
Resumindo, tivemos quatro diferentes blocos de técnicas principais.
>> Começamos como o conjunto de dados ou a pergunta que inspira você.
Você tenta extrair as informações dela, na forma de... de recursos.
Você alimenta esses recursos em um algoritmos de aprendizado de máquina,
esse é o centro do aprendizado de máquina.
Em seguida, você avalia o processo inteiro para ver se você teve um bom resultado.
Uma das coisas mais difíceis é realmente chegar ao conjunto de dados ou
à pergunta que interessa a você.
Um exemplo que adorei foi o conjunto de dados da Enron.
Para você, isso será algo diferente.
>> Gastamos muito tempo na aula sobre recursos, como apresentar recursos, como
se livrar de recursos, como encontrar novos espaços de recursos que realmente funcionem melhor.
E você pode aplicar essas técnicas a qualquer conjunto de dados para obter
conjuntos de recursos razoavelmente reais.
O coração e a alma desta aula foram os algoritmos que é
onde está a maior diversão no aprendizado de máquina.
Você sabe que eles são supervisionados se você tiver rótulos e
não supervisionados se você não tiver rótulos.
Há realmente mais aulas no aprendizado de máquina sobre as quais você pode falar, mas
no caso desta aula, isso é o que ensinamos a você.
E o que é realmente importante é que cada algoritmo precisa ser ajustado.
Falamos muito sobre como ajustar seus algoritmos.
>> Finalmente e não menos importante será a avaliação.
Como você está se saindo?
Há diferentes tipos de métricas de avaliação que podemos usar.
Depende... dependendo o que é mais importante para você.
E, neste ponto, depois que você fez seu caminho do início ao fim,
a métrica de avaliação irá dizer se você quer retornar e
revisitar qualquer uma dessas etapas.
Ou se você está contente com os resultados e pronto para continuar.
>> E a coisa boa é que esta é a aula inteira em um slide.
Isso não é incrível?
总的说来 我们有四种不同的主要技巧
从数据集或激发灵感的问题开始
你试着以特征的形式 从数据集中提取信息
将这些特征放入机器学习算法
这是机器学习的核心
之后你会评估整个过程 看看效果如何
最难的部分确实来自于数据集或
你所关心的问题
所以我喜欢以安然公司的数据集为例
你会发现别有洞天
我们用了很长时间讲述特征相关内容 比如如何呈现特征
删除特征 如何找到效果更好的新特征空间
你还可以将这些技巧应用到更多数据集
获取真正合理的特征集
本课的灵魂是算法
它是机器学习最有趣的地方
你知道如果有标签 它们则受到监督
如果没有标签 它们就没有监督
未来还有更多探讨机器学习的课程
但这些就是我们本课所教给你的内容
重要的是 每个算法都需要调整
我们讲述了很多如何对算法进行调整
最后 重要的一点是评价
你做得如何?
你可以使用不同类型的评价指标
这取决于你最重视哪里
此时一旦你从头到尾运行一遍
评价指标会告诉你 你是否需要重新
重复全部步骤
或者直到结果令你满意为止 然后再继续工作
很棒的是整堂课都在一张幻灯片上进行
很神奇吧?