So, what's really great about Pig is that it abstracts
away from the user the actual implementation of how the
calculation is done. So, you can write in a more
abstract language what kinds of operations should be performed to
your data. You can say, for example, join this data
set to this data set, or filter out this data
set, or reduce this data. But you're not telling it
how to do the analysis. And then Pig can decide
the fastest way to do it for you. So instead of having to write
very detailed jobs describing exactly what should
be done, you can just specify in an
abstract sense the calculation that needs to be done, and you can let the
computer do the hard work of figuring out the faster way to do the calculation.
لذلك، الأمر الرائع فعلاً بشأن أداة Pig هو أنها تستخرج
من المستخدم التنفيذ الفعلي لكيفية إجراء
العملية الحسابية. لذلك، يمكنك الكتابة بلغة أكثر
تجريدًا من أنواع العمليات التي يجب تنفيذها
لبياناتك. على سبيل المثال، يمكنك القول، ضم مجموعة
البيانات هذه إلى مجموعة البيانات هذه، أو فلترة مجموعة
البيانات هذه، أو التقليل من هذه البيانات. لكنك لم تذكر
كيفية إجراء التحليل. وبعد ذلك يمكن أن تقرر
أداة Pig أسرع طريقة لإجراء التحليل لك. لذلك، بدلا من الاضطرار إلى كتابة
مهام تفصيلية للغاية تصف ما يجب القيام به
بالضبط، ما عليك سوى تحديد العملية الحسابية الذي يجب إجراؤه
بطريقة تجريدية، ويمكنك ترك الكمبيوتر
.يؤدي العمل الشاق لمعرفة الطريقة الأسرع لإجراء العملية الحسابية
Pigのすばらしい点は
ユーザの手を離れて
実際に計算した方法を抽象化することです
データに実行することを
より抽象化した言葉で書くことができるのです
例えばあるデータをこちらのデータと合わせたい
またはこのデータを取り除きたいとか
データを減らしたいとします
しかし解析方法を書く必要はないのです
Pigが最速の実行方法を選んでくれます
何を行うか正確に細かく書く代わりに
必要な計算の要点を抽象的に
明示するだけでいいのです
より速い方法で答えを出すよう
コンピュータに任せるだけです
O que é muito bom no Pig é que ele
tira do usuário a implementação real de como o cálculo
é feito. Então, você pode escrever
em uma linguagem mais abstrata que tipos de operações devem ser executadas
em seus dados. Você pode dizer, por exemplo,
para unir esse conjunto de dados com aquele
, ou filtrar esse conjunto de dados ou reduzi-lo. Mas você não diz
como fazer a análise. E então o Pig pode decidir
o modo mais rápido de fazer isso por você. Em vez de escrever
tarefas muito detalhadas descrevendo exatamente o que deve ser feito,
você só precisa especificar, de maneira abstrata,
o cálculo que precisa ser feito,
e pode deixar o computador fazer o trabalhado árduo de descobrir o modo mais rápido de fazer o cálculo.