The new feature you're going to code up will be
called something like from_poi_to_this_person, which should be an integer.
It's the count of messages that are in this person's inbox but
are sent to them from persons of interest.
So here's what you'll do in the programming quiz.
From each message we have to extract the author of that message.
I've already done this for you.
So, that will be in the starter code.
Then what you have to do is you have to compare this author email address
to the list of known person of interest email addresses.
So basically, is the author a person of interest.
You return a boolean, which is the answer to that question and
then you repeat this over all the emails for a given person.
So that the outcome is this integer.
Give that a try in the programming quiz and when I show you the solution,
I'll show you what this feature actually looks like in the Enron data set.
ستُسمى الميزة الجديدة التي ستقومون بكتابة تعليمتها البرمجية
.بشيء مثل from_poi_to_this_person، والذي يجب أن يكون عددًا صحيحًا
إنه عدد الرسائل الموجودة في علبة الوارد لهذا الشخص
.ولكن تم إرسالها إليه من الأشخاص المعنيين
.لذا، إليكم ما ستفعلونه في اختبار البرمجة
،من كل رسالة علينا أن نستخرج مؤلفها
.وقد فعلت هذا بالفعل لأجلكم
.وسيكون ذلك في تعليمة بادئ التشغيل البرمجية
ثم ما يتوجب عليكم القيام به هو مقارنة عنوان البريد الإلكتروني لهذا المؤلف
.بقائمة عناوين البريد الإلكتروني للأشخاص المعنيين المعروفين
فهل يُعد المؤلف أحد الأشخاص المعنيين في الأساس؟
إنكم تقدمون دليلاً منطقيًا، والذي يُعد الجواب على هذا السؤال
.ثم تقومون بتكرار هذا الأمر مع جميع رسائل البريد الإلكتروني لشخص معين
.بحيث تكون النتيجة هذا العدد الصحيح
،جربوا ذلك في اختبار البرمجة وعندما أريكم الحل
.سأريكم ما تبدو عليه حقًا هذه الميزة في مجموعة بيانات Enron
O novo recurso que você irá codificar será chamado
de algo como from_poi_to_this_person, que deve ser um inteiro.
Ele é a contagem de mensagens que estão na caixa de entrada dessa pessoa,
mas são enviadas para elas de pessoas de interesse.
Então, isto é o que você fará no teste de programação.
De cada mensagem, temos de extrair o autor da mensagem.
Eu já fiz isso para você.
E isso estará no código base.
Em seguida, o que deve fazer é comparar o endereço de email deste autor
com a lista de endereços de email de pessoas de interesse conhecidas.
Basicamente, se o autor é uma pessoa de interesse.
Você retorna um booliano, que é a resposta a essa pergunta, e,
depois, repete isso em todos os emails de uma determinada pessoa.
De modo que o resultado seja um inteiro.
Experimente no teste de programação e, quando eu mostrar a solução,
tentarei mostrar qual é a aparência real deste recurso no conjunto de dados da Enron.
你要编码的新特征叫做
from_poi_to_this_person 结果应该是一个整数
它计算的是某人的收件箱内
来自嫌疑人的消息数量
你在编程测试中需要做的是
从每条消息中 提取消息的作者
之前我为你演示过这个过程
所以在启动代码中可以找到
你要做的是对比这个作者的邮件地址
以及已知的嫌疑人的邮件地址清单
基本上来说 邮件作者是否是嫌疑人
你返回一个 boolean 这就是问题的答案
然后你对某个人的所有邮件反复执行这个过程
最后的结果是个整数
在编程测试中试一试 在我向你演示解决方案时
我会告诉你在安然公司数据集中这个特征会是什么样子