So we're in a predicament. We want a small bin size to have as much detail as
possible about the location of data values, relative to the rest of the
distribution. But eventually, we start losing the shape of the distribution. But
if we have a large bin size, then we can't tell the proportion less than any
data value. We're going to handle this conundrum using a theoretical model for
our distributions. This model is a smooth curve that uses relative frequencies.
This is a theoretically continuous distribution that can be described with an
equation. This simple feature, an equation, allows us to calculate the
proportion between any two values on the x axis. We're not going to discuss or
analyze this equation in this class, but we can definitely go in depth into
forms if you'd like. Now what will be the area under this curve? This is a
really tricky problem. Just remember that when we had a histogram, what did all
the relative frequencies add to?
Temos um dilema.
Queremos um compartimento pequeno
com tantos detalhes quanto possível
sobre a localização de valores
em relação ao resto da distribuição,
mas por fim começamos
a perder a forma da distribuição.
Mas se tivermos um compartimento grande,
não sabemos a proporção menor
que nenhum valor.
Vamos resolver esse problema
usando um modelo teórico
para nossas distribuições.
Este modelo é uma curva suave
que usa frequências relativas.
Esta é uma distribuição teoricamente contínua
que pode ser descrita com uma equação.
Este simples recurso,
uma equação nos permite calcular
a proporção entre quaisquer dois valores
no eixo de X.
Não vamos discutir
ou analisar esta equação nesta classe,
mas podemos ver mais a fundo
as formas, se quiser.
Qual será a área sob esta curva?
É um problema complicado.
Lembra quando tínhamos um histograma,
qual foi a soma das frequências relativas?
现在我们陷入了困境 我们想要很小的组距 尽量提供更多的细节信息
描述出数据值相对于分布图剩余数据值的位置
最终 我们开始丢失分布图的形状
如果组距很大 则无法判断小于任何数据值的比例
我们将使用一个分布图理论模型来解决这一难题
该模型的曲线比较光滑 使用的是相对频率
这是一个理论上连续的分布图 可以用方程式来表示
这个简单的功能 即方程式 使我们能够计算 x 轴上任何两个值之间的比例
在这节课我们不会讨论或分析该方程式
但是可以详细介绍这些图形
这个曲线下的面积是多少?
这是个非常难的问题 注意 对于这个柱状图
所有相对频率的和是多少?