[Thrun] The science of how images are created using cameras is called image formation,
where formation just means the way an image is being captured.
Perhaps the easiest model of a camera is called a pinhole camera.
In a pinhole camera, the light from within the world
goes through a various small hole--ideally it's a really, really small hole--
to project into a camera chip that sits somewhere in the background.
So for example, if you had an object that was a person over here,
then this person would be projected as follows.
The feet would be projected to over here and the head to over here,
which gives us this inverted person on the projection plane or the camera chip.
There is some very basic math that governs the geometry of a pinhole camera.
If we call X the physical height of the object and small x the height of the projection,
which I'll call -x because it points in the opposite direction as the original object,
then we can also talk about other values
such as the distance of the object to the camera plane
and f, which is the focal distance of the camera,
which is the distance between the pinhole and the projection plane over here.
There's a simple piece of math that relates all of those 4 variables over here,
and it's easily obtained by what's called equal triangles.
In particular, it turns out if I map this triangle over here to right over here--
so these are the same triangles, just flipped, where x is over here and f is over here--
we get that the ratio of upper caps X to Z is the same as lower caps x to f.
So I write this as follows.
This is a result of equal triangles.
So as you take a triangle of a certain shape,
when you scale it up to larger triangles, those proportions are retained,
so therefore, upper caps X divided by Z is the same as lower caps x divided by f.
If we now transform this, I find that the projection of lower caps x,
which I might care about, is upper caps X, the physical size of the object itself,
times the quotient of the focal length over the distance.
That's an interesting equation.
The further an object is away, the smaller it appears.
The larger the focal length of the camera, the larger the object in its projection.
And of course the size of the object itself directly influences
how big its image of the object really is.
So let's see if you can practice that equation using a quiz.
カメラを使ってイメージを作り出すことを
像形成と言います
ここでの形成とは
イメージをキャプチャすることを意味しています
おそらくもっとも簡単なカメラは
ピンホールカメラです
ピンホールカメラは周囲の光を
様々な小さな穴に通します
穴は小さいほど理想的です
奥にあるカメラのチップに投影します
例えば対象である人物がここにいます
この人物は次のように投影されます
足がここに投影されます 頭はここです
投影面またはカメラのチップに
逆転した人物が写ります
ピンホールカメラの構造を支配する
とても基本的な計算があります
対象の高さをX
投影物の高さを小文字のxとします
本来の対象と反対方向なので-xと呼びます
他の値についてもお話ししましょう
Zは対象からカメラの面までの距離です
fはカメラの焦点距離
つまりピンホールと投影面の間の距離です
簡単な計算で
4つの変数を全部関連づけることができます
いわゆる相似三角形です
特にこの三角形をここに描くと
同じ三角形になります
反転しているので
xはここでfはここになります
この大文字のXとZの比率は小文字のxとfと同じです
このように書きます
これが相似三角形の結果です
ある形の三角形を書くとします
大きく拡大してもこの比率は同じです
従って大文字のXをZで割った数字と
小文字xをfで割った数字は同じです
これを変換すると小文字のxの投影が分かります
対象の実際のサイズである大文字のXに
カメラの焦点距離と距離の商を掛けます
面白い方程式です
対象が離れるほど小さくなります
カメラの焦点距離が大きくなるほど
投影された対象は大きくなります
もちろん対象のサイズは
イメージがどれぐらい大きくなるかに関して
直接影響します
その方程式を使えるか
小テストで試してみましょう