Probabilitas variabel acak yang terdistribusi normal. Hukum distribusi probabilitas normal untuk variabel acak kontinu. Hubungan dengan distribusi lain

Mengganti φ(x)=π /4 ,f(x)=1/(b-a)

D[π /4]=( /720) ).

№319 Tepi kubus X diukur kira-kira, dan A . Mengingat rusuk kubus sebagai variabel acak X, terdistribusi merata pada interval (a,b), carilah ekspektasi matematis dan varians volume kubus.

1. Mari kita cari ekspektasi matematis dari luas lingkaran – variabel acak kamu=φ(K)= - sesuai dengan rumusnya

M[φ(X)]=

Dengan menempatkan φ(x)= ,f(x)=1/(b-a) dan melakukan integrasi, kita dapatkan

M( )=
.

2. Carilah luas lingkaran dengan menggunakan rumus

D [φ(X)]= - .

Mengganti φ(x)= ,f(x)=1/(b-a) dan melakukan integrasi, kita dapatkan

D = .

№320 Variabel acak X dan Y saling bebas dan berdistribusi seragam: X pada interval (a,b), Y pada interval (c,d).

Ekspektasi matematis dari produk variabel acak independen sama dengan produk ekspektasi matematisnya, yaitu.

M(XY)=

№321 Variabel acak X dan Y saling bebas dan terdistribusi merata: X pada interval (a,b), Y pada interval (c,d). Tentukan varians produk XY.

Mari kita gunakan rumusnya

D(XY)=M[

Oleh karena itu, ekspektasi matematis dari produk variabel acak independen sama dengan produk ekspektasi matematisnya

Mari kita cari M menggunakan rumus

M[φ(X)]=

Mengganti φ(x)= ,f(x)=1/(b-a) dan melakukan integrasi, kita dapatkan

M (**)

Kita juga dapat menemukannya

M (***)

Mengganti M(X)=(a+b)/2, M(Y)=(c+d)/2, serta (***) dan (**) di (*), akhirnya kita dapatkan

D(XY)= -[ .

№322 Ekspektasi matematis dari variabel acak berdistribusi normal X adalah a=3 dan simpangan baku σ=2.

Mari kita gunakan rumus:

f(x)= .

Mengganti nilai-nilai yang tersedia, kita mendapatkan:

f(x)= =f(x)= .

№323 Tuliskan kepadatan probabilitas dari variabel acak X yang terdistribusi normal, dengan mengetahui bahwa M(X)=3, D(X)=16.

Mari kita gunakan rumus:

f(x)= .

Untuk mencari nilai σ, kita menggunakan sifat simpangan baku suatu variabel acak X sama dengan akar kuadrat variansnya. Oleh karena itu σ=4, M(X)=a=3. Mengganti ke dalam rumus yang kita dapatkan

f(x)= = .

№324 Variabel acak yang terdistribusi normal X diberikan oleh kepadatan

f(x)= . Temukan ekspektasi matematis dan varians dari X.

Mari kita gunakan rumusnya

f(x)= ,

Di mana A-nilai yang diharapkan, σ - standar deviasi X. Dari rumus ini dapat disimpulkan bahwa a=M(X)=1. Untuk mencari variansnya, kita menggunakan sifat standar deviasi suatu variabel acak X sama dengan akar kuadrat variansnya. Karena itu D(X)= =

Jawaban: ekspektasi matematis adalah 1; variansnya adalah 25.

Bondarchuk Rodion

Mengingat fungsi distribusi dari hukum normal yang dinormalisasi . Temukan kepadatan distribusi f(x).

Mengetahui bahwa , carilah f(x).

Menjawab:

Buktikan bahwa fungsi Laplace . aneh: .

Kami akan membuat penggantinya

Kami melakukan substitusi terbalik dan mendapatkan:

= =



Akan ada juga masalah yang harus Anda selesaikan sendiri, dan Anda dapat melihat jawabannya.

Distribusi normal: landasan teori

Contoh variabel acak yang terdistribusi menurut hukum normal adalah tinggi badan seseorang dan massa ikan dari spesies yang sama yang ditangkap. Distribusi normal artinya sebagai berikut : terdapat nilai tinggi badan manusia, massa ikan dari spesies yang sama, yang secara intuitif dianggap “normal” (dan pada kenyataannya, dirata-ratakan), dan dalam sampel yang cukup besar nilai-nilai tersebut lebih sering ditemukan daripada nilai yang berbeda ke atas atau ke bawah.

Distribusi probabilitas normal dari variabel acak kontinu (kadang-kadang distribusi Gaussian) dapat disebut berbentuk lonceng karena fakta bahwa fungsi kepadatan distribusi ini, simetris terhadap mean, sangat mirip dengan potongan lonceng (kurva merah pada gambar di atas).

Probabilitas menemukan nilai-nilai tertentu dalam sampel sama dengan luas gambar di bawah kurva, dan dalam kasus distribusi normal kita melihat bahwa di bawah bagian atas “lonceng”, yang sesuai dengan nilai ​​cenderung ke rata-rata, luas, dan oleh karena itu probabilitasnya, lebih besar daripada di bawah tepian. Jadi, kita mendapatkan hal yang sama seperti yang telah dikatakan: kemungkinan bertemu seseorang dengan tinggi badan “normal” dan menangkap ikan dengan berat “normal” lebih tinggi daripada nilai yang berbeda ke atas atau ke bawah. Dalam banyak kasus praktis, kesalahan pengukuran didistribusikan menurut hukum yang mendekati normal.

Mari kita lihat kembali gambar di awal pelajaran yang menunjukkan fungsi massa jenis berdistribusi normal. Grafik fungsi ini diperoleh dengan menghitung sampel data tertentu dalam paket perangkat lunak STATISTIK. Di atasnya, kolom histogram mewakili interval nilai sampel, yang distribusinya mendekati (atau, seperti yang biasa dikatakan dalam statistik, tidak berbeda secara signifikan dari) grafik sebenarnya dari fungsi kepadatan distribusi normal, yaitu kurva merah. . Grafik menunjukkan bahwa kurva ini memang berbentuk lonceng.

Distribusi normal sangat berharga dalam banyak hal karena hanya dengan mengetahui nilai yang diharapkan dari variabel acak kontinu dan deviasi standarnya, Anda dapat menghitung probabilitas apa pun yang terkait dengan variabel tersebut.

Distribusi normal juga memiliki keuntungan karena merupakan salah satu distribusi yang paling mudah digunakan. uji statistik yang digunakan untuk menguji hipotesis statistik - Uji t Student- hanya dapat digunakan jika data sampel mematuhi hukum distribusi normal.

Fungsi kepadatan distribusi normal dari variabel acak kontinu dapat dicari dengan menggunakan rumus:

,

Di mana X- nilai besaran yang berubah, - nilai rata-rata, - simpangan baku, e=2.71828... - basis logaritma natural, =3.1416...

Sifat-sifat fungsi kepadatan distribusi normal

Perubahan mean menggerakkan kurva fungsi kepadatan normal menuju sumbu Sapi. Jika bertambah maka kurva bergerak ke kanan, jika menurun maka ke kiri.

Jika simpangan baku berubah, ketinggian puncak kurva pun berubah. Ketika deviasi standar meningkat, puncak kurva menjadi lebih tinggi, dan ketika deviasi standar menurun, maka kurva menjadi lebih rendah.

Probabilitas suatu variabel acak yang terdistribusi normal berada dalam interval tertentu

Di paragraf ini kita akan mulai memecahkan masalah-masalah praktis, yang maknanya ditunjukkan dalam judul. Mari kita lihat kemungkinan apa yang diberikan teori untuk memecahkan masalah. Konsep awal untuk menghitung peluang suatu variabel acak berdistribusi normal jatuh ke dalam interval tertentu adalah fungsi kumulatif dari distribusi normal.

Fungsi distribusi normal kumulatif:

.

Namun, sulit untuk mendapatkan tabel untuk setiap kemungkinan kombinasi mean dan deviasi standar. Oleh karena itu, salah satu cara sederhana untuk menghitung probabilitas suatu variabel acak berdistribusi normal yang masuk ke dalam interval tertentu adalah dengan menggunakan tabel probabilitas untuk distribusi normal terstandar.

Distribusi normal disebut terstandarisasi atau ternormalisasi., meannya adalah , dan simpangan bakunya adalah .

Fungsi Kepadatan Distribusi Normal Standar:

.

Fungsi kumulatif dari distribusi normal terstandar:

.

Gambar di bawah menunjukkan fungsi integral dari distribusi normal terstandar, yang grafiknya diperoleh dengan menghitung sampel data tertentu dalam paket perangkat lunak STATISTIK. Grafiknya sendiri berbentuk kurva merah, dan nilai sampelnya mendekatinya.


Untuk memperbesar gambar, Anda dapat mengkliknya dengan tombol kiri mouse.

Menstandardisasi variabel acak berarti berpindah dari satuan awal yang digunakan dalam tugas ke satuan standar. Standardisasi dilakukan sesuai rumus

Dalam prakteknya, semua kemungkinan nilai suatu variabel acak seringkali tidak diketahui, sehingga nilai mean dan deviasi standar tidak dapat ditentukan secara akurat. Mereka digantikan oleh rata-rata observasi aritmatika dan deviasi standar S. Besarnya z menyatakan deviasi nilai suatu variabel acak dari mean aritmatika ketika mengukur deviasi standar.

Interval terbuka

Tabel probabilitas untuk distribusi normal terstandar, yang dapat ditemukan di hampir semua buku statistik, berisi probabilitas bahwa variabel acak yang memiliki distribusi normal standar Z akan mengambil nilai kurang dari angka tertentu z. Artinya, ia akan masuk ke dalam interval terbuka dari minus tak terhingga hingga z. Misalnya, probabilitas kuantitasnya Z kurang dari 1,5, sama dengan 0,93319.

Contoh 1. Perusahaan memproduksi suku cadang yang masa pakainya berdistribusi normal dengan rata-rata 1000 jam dan simpangan baku 200 jam.

Untuk bagian yang dipilih secara acak, hitung probabilitas bahwa masa pakainya paling sedikit 900 jam.

Larutan. Mari kita perkenalkan notasi pertama:

Probabilitas yang diinginkan.

Nilai variabel acak berada dalam interval terbuka. Namun kita tahu cara menghitung probabilitas suatu variabel acak akan mengambil nilai yang lebih kecil dari nilai tertentu, dan sesuai dengan kondisi soal, kita perlu mencari nilai yang sama atau lebih besar dari nilai tertentu. Ini adalah bagian lain dari ruang di bawah kurva kepadatan normal (lonceng). Oleh karena itu, untuk mencari probabilitas yang diinginkan, Anda perlu mengurangkan dari kesatuan probabilitas yang disebutkan bahwa variabel acak akan mengambil nilai kurang dari 900 yang ditentukan:

Sekarang variabel acak perlu distandarisasi.

Kami terus memperkenalkan notasi:

z = (X ≤ 900) ;

X= 900 - nilai tertentu dari variabel acak;

μ = 1000 - nilai rata-rata;

σ = 200 - simpangan baku.

Dengan menggunakan data ini, kita memperoleh kondisi masalah:

.

Menurut tabel variabel acak terstandar (batas interval) z= −0,5 sama dengan probabilitas 0,30854. Kurangi dari kesatuan dan dapatkan apa yang diperlukan dalam pernyataan masalah:

Jadi, peluang suatu suku cadang tersebut mempunyai masa pakai paling sedikit 900 jam adalah 69%.

Probabilitas ini dapat diperoleh dengan menggunakan fungsi MS Excel NORM.DIST (nilai integral - 1):

P(X≥900) = 1 - P(X≤900) = 1 - NORM.DIST(900; 1000; 200; 1) = 1 - 0,3085 = 0,6915.

Tentang perhitungan di MS Excel - di salah satu paragraf selanjutnya dari pelajaran ini.

Contoh 2. Di suatu kota tertentu, rata-rata pendapatan keluarga per tahun merupakan variabel acak yang berdistribusi normal dengan mean sebesar 300.000 dan simpangan baku sebesar 50.000. Diketahui pendapatan 40% keluarga kurang dari itu A. Temukan nilainya A.

Larutan. Dalam soal ini, 40% tidak lebih dari peluang suatu variabel acak mengambil nilai dari interval terbuka yang kurang dari nilai tertentu, yang ditunjukkan dengan huruf A.

Untuk menemukan nilainya A, pertama kita buat fungsi integralnya:

Sesuai dengan kondisi permasalahannya

μ = 300.000 - nilai rata-rata;

σ = 50.000 - standar deviasi;

X = A- jumlah yang dapat ditemukan.

Menciptakan kesetaraan

.

Dari tabel statistik kita menemukan bahwa probabilitas 0,40 sesuai dengan nilai batas interval z = −0,25 .

Oleh karena itu, kita ciptakan kesetaraan

dan temukan solusinya:

A = 287300 .

Jawaban: 40% keluarga mempunyai pendapatan kurang dari 287.300.

Interval tertutup

Dalam banyak soal, kita perlu mencari probabilitas bahwa variabel acak yang berdistribusi normal akan mengambil nilai dalam interval dari z 1 sampai z 2. Artinya, akan masuk ke dalam interval tertutup. Untuk menyelesaikan masalah seperti itu, perlu dicari dalam tabel probabilitas yang sesuai dengan batas interval, dan kemudian mencari perbedaan antara probabilitas tersebut. Hal ini memerlukan pengurangan nilai yang lebih kecil dari nilai yang lebih besar. Contoh solusi dari permasalahan umum tersebut adalah sebagai berikut, dan Anda diminta untuk menyelesaikannya sendiri, kemudian Anda dapat melihat solusi dan jawaban yang benar.

Contoh 3. Laba suatu perusahaan pada suatu periode tertentu merupakan variabel acak yang tunduk pada hukum distribusi normal dengan nilai rata-rata 0,5 juta. dan standar deviasi 0,354. Tentukan, akurat hingga dua angka desimal, probabilitas bahwa keuntungan perusahaan akan berkisar antara 0,4 hingga 0,6 c.u.

Contoh 4. Panjang bagian yang diproduksi adalah variabel acak yang didistribusikan menurut hukum normal dengan parameter μ =10 dan σ =0,071. Temukan, akurat hingga dua tempat desimal, kemungkinan cacat jika dimensi bagian yang diizinkan harus 10±0,05.

Petunjuk: dalam soal ini, selain mencari peluang suatu variabel acak masuk ke dalam interval tertutup (peluang menerima bagian yang tidak rusak), Anda perlu melakukan satu tindakan lagi.

memungkinkan Anda menentukan probabilitas bahwa nilai standar Z tidak kurang -z Dan tidak lagi +z, Di mana z- nilai yang dipilih secara sewenang-wenang dari variabel acak standar.

Metode perkiraan untuk memeriksa normalitas suatu distribusi

Perkiraan metode untuk memeriksa normalitas distribusi nilai sampel didasarkan pada hal berikut sifat distribusi normal: koefisien kemiringan β 1 dan koefisien kurtosis β 2 sama dengan nol.

Koefisien asimetri β 1 secara numerik mencirikan simetri distribusi empiris relatif terhadap mean. Jika koefisien skewness adalah nol, maka mean aritmetri, median, dan modus adalah sama: dan kurva kepadatan distribusi simetris terhadap mean. Jika koefisien asimetri kurang dari nol (β 1 < 0 ), maka mean aritmatikanya lebih kecil dari median, dan mediannya, pada gilirannya, lebih kecil dari modus () dan kurvanya bergeser ke kanan (dibandingkan dengan distribusi normal). Jika koefisien asimetri lebih besar dari nol (β 1 > 0 ), maka mean aritmatika lebih besar dari median, dan median, pada gilirannya, lebih besar dari modus () dan kurvanya bergeser ke kiri (dibandingkan dengan distribusi normal).

Koefisien kurtosis β 2 mencirikan konsentrasi distribusi empiris di sekitar mean aritmatika dalam arah sumbu Oi dan derajat puncak kurva kepadatan distribusi. Jika koefisien kurtosis lebih besar dari nol, maka kurvanya lebih memanjang (dibandingkan distribusi normal) sepanjang sumbu Oi(grafiknya lebih memuncak). Jika koefisien kurtosis kurang dari nol, maka kurvanya lebih rata (dibandingkan distribusi normal) sepanjang sumbu Oi(grafiknya lebih tumpul).

Koefisien asimetri dapat dihitung menggunakan fungsi MS Excel SKOS. Jika Anda mencentang satu larik data, maka Anda perlu memasukkan rentang data dalam satu kotak “Nomor”.


Koefisien kurtosis dapat dihitung menggunakan fungsi KURTESS MS Excel. Saat mencentang satu larik data, cukup memasukkan rentang data dalam satu kotak “Nomor”.


Jadi seperti yang telah kita ketahui, dengan distribusi normal koefisien skewness dan kurtosis sama dengan nol. Namun bagaimana jika kita mendapatkan koefisien skewness sebesar -0,14, 0,22, 0,43 dan koefisien kurtosis sebesar 0,17, -0,31, 0,55? Pertanyaannya cukup adil, karena dalam praktiknya kita hanya berurusan dengan perkiraan, nilai sampel asimetri dan kurtosis, yang tunduk pada penyebaran yang tak terhindarkan dan tidak terkendali. Oleh karena itu, seseorang tidak dapat menuntut agar koefisien-koefisien ini benar-benar sama dengan nol; koefisien-koefisien tersebut hanya boleh mendekati nol. Namun apa yang dimaksud dengan cukup?

Nilai empiris yang diperoleh perlu dibandingkan dengan nilai yang dapat diterima. Untuk melakukan ini, Anda perlu memeriksa ketidaksetaraan berikut (bandingkan nilai koefisien modulus dengan nilai kritis - batas area pengujian hipotesis).

Untuk koefisien asimetri β 1 .

Hukum distribusi normal paling sering ditemui dalam praktik. Ciri utama yang membedakannya dari undang-undang lain adalah bahwa ia merupakan undang-undang yang membatasi, yang didekati oleh undang-undang distribusi lainnya dalam kondisi tipikal yang sangat umum.

Definisi. Variabel acak kontinu yang dimiliki X hukum biasa distribusi(hukum Gauss )dengan parameter a dan σ 2 jika kepadatan probabilitasnya f(X) seperti:

. (6.19)

Kurva distribusi normal disebut normal atau Kurva Gaussian. Pada Gambar. 6.5 a), b) menunjukkan kurva normal dengan parameter A Dan σ 2 dan grafik fungsi distribusi.

Mari kita perhatikan fakta bahwa kurva normal adalah simetris terhadap garis lurus X = A, memiliki titik maksimum X = A, sama dengan , dan dua titik belok X = A σ dengan ordinat.

Dapat dicatat bahwa dalam ekspresi hukum kepadatan normal, parameter distribusi ditunjukkan dengan huruf A Dan σ 2, yang kami gunakan untuk menunjukkan ekspektasi dan dispersi matematis. Kebetulan ini bukanlah suatu kebetulan. Mari kita perhatikan sebuah teorema yang menetapkan makna teoretis probabilistik dari parameter hukum normal.

Dalil. Ekspektasi matematis dari variabel acak X, yang terdistribusi menurut hukum normal, sama dengan parameter a dari distribusi ini, yaitu

M(X) = A, (6.20)

dan dispersinya – ke parameter σ 2, yaitu

D(X) = σ 2. (6.21)

Mari kita cari tahu bagaimana kurva normal akan berubah ketika parameternya berubah A Dan σ .

Jika σ = const, dan parameternya berubah A (A 1 < A 2 < A 3), yaitu pusat simetri distribusi, maka kurva normal akan bergeser sepanjang sumbu absis tanpa mengubah bentuknya (Gbr. 6.6).

Beras. 6.6

Beras. 6.7

Jika A= const dan parameternya berubah σ , maka ordinat maksimum kurva berubah f maks(A) = . Ketika meningkat σ ordinat maksimumnya berkurang, tetapi karena luas di bawah kurva distribusi harus tetap sama dengan satu, kurva menjadi lebih datar, memanjang sepanjang sumbu x. Saat menurun σ Sebaliknya, kurva normal memanjang ke atas sekaligus menekan dari samping (Gbr. 6.7).

Jadi parameternya A mencirikan posisi, dan parameter σ – bentuk kurva normal.

Hukum distribusi normal suatu variabel acak dengan parameter A= 0 dan σ = 1 dipanggil standar atau dinormalisasi, dan kurva normal yang sesuai adalah standar atau dinormalisasi.

Sulitnya mencari secara langsung fungsi distribusi suatu variabel acak yang terdistribusi menurut hukum normal karena integral fungsi distribusi normal tidak dinyatakan melalui fungsi dasar. Namun, dapat dihitung melalui fungsi khusus yang menyatakan integral tertentu dari ekspresi atau. Fungsi ini disebut Fungsi Laplace, tabel telah dikompilasi untuk itu. Ada banyak ragam fungsi ini, misalnya:

, .

Kami akan menggunakan fungsinya

Mari kita perhatikan sifat-sifat variabel acak yang terdistribusi menurut hukum normal.

1. Peluang suatu variabel acak X yang terdistribusi menurut hukum normal berada dalam interval [α , β ] sama dengan

Dengan menggunakan rumus ini, kami menghitung probabilitas untuk berbagai nilai δ (menggunakan tabel nilai fungsi Laplace):

pada δ = σ = 2Ф(1) = 0,6827;

pada δ = 2σ = 2Ф(2) = 0,9545;

pada δ = 3σ = 2Ф(3) = 0,9973.

Hal ini mengarah pada apa yang disebut “ aturan tiga sigma»:

Jika suatu variabel acak X mempunyai hukum distribusi normal dengan parameter a dan σ, maka hampir dapat dipastikan nilainya terletak pada interval tersebut.(A – 3σ ; A + 3σ ).

Contoh 6.3. Dengan asumsi tinggi badan laki-laki pada kelompok umur tertentu merupakan variabel acak yang berdistribusi normal X dengan parameter A= 173 dan σ 2 = 36, temukan:

1. Ekspresi kepadatan probabilitas dan fungsi distribusi suatu variabel acak X;

2. Bagian pakaian dengan tinggi ke-4 (176 - 183 cm) dan bagian pakaian dengan tinggi ke-3 (170 - 176 cm), yang harus dimasukkan dalam total volume produksi untuk kelompok umur ini;

3. Merumuskan “aturan tiga sigma” untuk variabel acak X.

1. Menemukan kepadatan probabilitas

dan fungsi distribusi variabel acak X

= .

2. Kami menemukan proporsi pakaian dengan tinggi 4 (176 – 182 cm) sebagai probabilitas

R(176 ≤ X ≤ 182) = = Ф(1,5) – Ф(0,5).

Menurut tabel nilai fungsi Laplace ( Lampiran 2) kami menemukan:

F(1,5) = 0,4332, F(0,5) = 0,1915.

Akhirnya kita dapatkan

R(176 ≤ X ≤ 182) = 0,4332 – 0,1915 = 0,2417.

Pembagian setelan dengan tinggi ke-3 (170 – 176 cm) dapat dicari dengan cara serupa. Namun, hal ini lebih mudah dilakukan jika kita memperhitungkan bahwa interval ini simetris terhadap ekspektasi matematis A= 173, yaitu ketimpangan 170 ≤ X≤ 176 setara dengan ketimpangan │ X– 173│≤ 3. Lalu

R(170 ≤X ≤176) = R(│X– 173│≤ 3) = 2Ф(3/6) = 2Ф(0,5) = 2·0,1915 = 0,3830.

3. Mari kita rumuskan “aturan tiga sigma” untuk variabel acak X:

Hampir dapat dipastikan tinggi badan pria pada kelompok umur ini berkisar antara A – 3σ = 173 – 3 6 = 155 sampai A + 3σ = 173 + 3·6 = 191, mis. 155 ≤ X ≤ 191. ◄


7. TEOREMA BATAS TEORI PROBABILITAS

Seperti yang telah disebutkan ketika mempelajari variabel acak, tidak mungkin untuk memprediksi terlebih dahulu berapa nilai yang akan diperoleh variabel acak sebagai hasil dari satu pengujian - ini tergantung pada banyak alasan yang tidak dapat diperhitungkan.

Namun, dengan pengujian yang berulang-ulang, perilaku penjumlahan variabel acak hampir kehilangan karakter acaknya dan menjadi alami. Kehadiran pola justru dikaitkan dengan sifat massa dari fenomena yang secara keseluruhan menghasilkan variabel acak yang tunduk pada hukum yang sangat spesifik. Inti dari stabilitas fenomena massa adalah sebagai berikut: ciri-ciri spesifik dari setiap fenomena acak hampir tidak berpengaruh pada hasil rata-rata massa fenomena tersebut; penyimpangan acak dari rata-rata, yang tidak dapat dihindari dalam setiap fenomena individu, saling dibatalkan, diratakan, diratakan dalam massa.

Stabilitas rata-rata inilah yang mewakili isi fisik dari "hukum bilangan besar", yang dipahami dalam arti luas: dengan sejumlah besar fenomena acak, hasilnya secara praktis tidak lagi acak dan dapat diprediksi dengan menggunakan tingkat kepastian yang tinggi.

Dalam arti sempit, “hukum bilangan besar” dalam teori probabilitas dipahami sebagai serangkaian teorema matematika, yang masing-masing, untuk kondisi tertentu, menetapkan fakta bahwa karakteristik rata-rata dari sejumlah besar eksperimen mendekati tertentu. konstanta tertentu.

Hukum bilangan besar memainkan peran penting dalam penerapan praktis teori probabilitas. Sifat variabel acak, dalam kondisi tertentu, untuk berperilaku hampir seperti variabel non-acak memungkinkan seseorang untuk beroperasi dengan percaya diri dengan besaran-besaran ini dan memprediksi hasil fenomena acak massal dengan kepastian yang hampir sempurna.

Kemungkinan prediksi semacam itu di bidang fenomena acak massa semakin diperluas dengan hadirnya kelompok teorema limit lain, yang tidak menyangkut nilai pembatas variabel acak, tetapi hukum distribusi pembatas. Kita berbicara tentang sekelompok teorema yang dikenal sebagai “teorema limit pusat”. Berbagai bentuk teorema limit pusat berbeda satu sama lain dalam kondisi di mana sifat pembatas dari jumlah variabel acak ini ditetapkan.

Berbagai bentuk hukum bilangan besar dengan berbagai bentuk teorema limit pusat membentuk himpunan yang disebut membatasi teorema teori probabilitas. Teorema limit memungkinkan tidak hanya membuat prakiraan ilmiah dalam bidang fenomena acak, tetapi juga mengevaluasi keakuratan prakiraan tersebut.

Variabel acak disebut didistribusikan menurut hukum normal (Gaussian) dengan parameter A Dan () , jika kepadatan distribusi probabilitas berbentuk

Besaran yang terdistribusi normal selalu memiliki jumlah kemungkinan nilai yang tak terhingga, sehingga lebih mudah untuk menggambarkannya secara grafis menggunakan grafik kepadatan distribusi. Menurut rumusnya

probabilitas suatu variabel acak akan mengambil nilai dari suatu interval sama dengan luas di bawah grafik suatu fungsi pada interval tersebut (arti geometri dari integral tertentu). Fungsi yang dipertimbangkan adalah non-negatif dan kontinu. Grafik fungsi berbentuk lonceng dan disebut kurva Gaussian atau kurva normal.

Gambar tersebut menunjukkan beberapa kurva kepadatan distribusi variabel acak yang ditentukan menurut hukum normal.

Semua kurva memiliki satu titik maksimum, dan saat Anda menjauh dari titik tersebut ke kanan dan kiri, kurva tersebut mengecil. Maksimum dicapai pada dan sama dengan .

Kurvanya simetris terhadap garis vertikal yang melalui titik tertinggi. Luas subgraf setiap kurva adalah 1.

Perbedaan antara kurva distribusi individu hanya pada luas total subgraf, sama untuk semua kurva, didistribusikan secara berbeda antar bagian yang berbeda. Bagian utama dari area subgraf dari setiap kurva terkonsentrasi di sekitar nilai yang paling mungkin, dan nilai ini berbeda untuk ketiga kurva. Untuk nilai yang berbeda dan A diperoleh hukum normal yang berbeda dan grafik fungsi distribusi kepadatan yang berbeda.

Studi teoritis menunjukkan bahwa sebagian besar variabel acak yang ditemui dalam praktik memiliki hukum distribusi normal. Menurut hukum ini, kecepatan molekul gas, berat bayi baru lahir, ukuran pakaian dan sepatu penduduk suatu negara, dan banyak kejadian acak lainnya yang bersifat fisik dan biologis didistribusikan. Pola ini pertama kali diperhatikan dan dibuktikan secara teoritis oleh A. Moivre.

Untuk , fungsi tersebut bertepatan dengan fungsi yang telah dibahas dalam teorema limit lokal Moivre – Laplace. Kepadatan probabilitas distribusi normal mudah saja diungkapkan melalui:

Untuk nilai parameter seperti itu, disebut hukum normal utama .

Fungsi distribusi untuk kepadatan yang dinormalisasi disebut Fungsi Laplace dan ditunjuk (x). Kami juga telah menemukan fungsi ini.

Fungsi Laplace tidak bergantung pada parameter tertentu A dan σ. Untuk fungsi Laplace, dengan menggunakan metode integrasi perkiraan, tabel nilai pada interval dengan berbagai tingkat akurasi telah disusun. Jelas sekali, fungsi Laplace ganjil, oleh karena itu, tidak perlu memasukkan nilainya ke dalam tabel untuk negatif .



Untuk variabel acak yang terdistribusi menurut hukum normal dengan parameter A dan , ekspektasi dan dispersi matematis dihitung dengan menggunakan rumus: , .Standar deviasi sama dengan .

Peluang suatu besaran yang terdistribusi normal akan mengambil nilai dari interval adalah sama dengan

di mana fungsi Laplace diperkenalkan dalam teorema limit integral.

Seringkali dalam permasalahan diperlukan untuk menghitung probabilitas penyimpangan dari variabel acak yang terdistribusi normal X dari ekspektasi matematisnya nilai absolutnya tidak melebihi nilai tertentu, yaitu menghitung probabilitas. Menerapkan rumus (19.2), kita mendapatkan:

Sebagai kesimpulan, kami menyajikan satu akibat wajar penting dari rumus (19.3). Mari kita masukkan ke dalam rumus ini. Kemudian, yaitu. probabilitas bahwa nilai absolut dari deviasi X ekspektasi matematisnya tidak akan melebihi , sebesar 99,73%. Dalam praktiknya, peristiwa semacam itu bisa dianggap dapat diandalkan. Inilah inti dari aturan tiga sigma.

Aturan tiga sigma. Jika suatu variabel acak berdistribusi normal, maka nilai absolut simpangannya dari ekspektasi matematis praktis tidak melebihi tiga kali simpangan baku.

Artikel ini menjelaskan secara rinci apa hukum distribusi normal variabel acak dan bagaimana menggunakannya dalam memecahkan masalah praktis.

Distribusi normal dalam statistik

Sejarah hukum dimulai 300 tahun yang lalu. Penemu pertama adalah Abraham de Moivre, yang melakukan perkiraan tersebut pada tahun 1733. Bertahun-tahun kemudian, Carl Friedrich Gauss (1809) dan Pierre-Simon Laplace (1812) menurunkan fungsi matematika.

Laplace juga menemukan pola yang luar biasa dan merumuskannya teorema limit pusat (CPT), yang menyatakan bahwa jumlah sejumlah besar besaran kecil dan bebas mempunyai distribusi normal.

Hukum normal bukanlah persamaan tetap tentang ketergantungan suatu variabel terhadap variabel lainnya. Hanya sifat ketergantungan ini yang dicatat. Bentuk distribusi spesifik ditentukan oleh parameter khusus. Misalnya, y = kapak + b adalah persamaan garis lurus. Namun, di mana tepatnya ia lewat dan pada sudut berapa ditentukan oleh parameter A Dan B. Sama dengan distribusi normal. Jelas bahwa ini adalah fungsi yang menggambarkan kecenderungan konsentrasi nilai yang tinggi di sekitar pusat, tetapi bentuk pastinya ditentukan oleh parameter khusus.

Kurva distribusi normal Gaussian terlihat seperti ini.

Grafik distribusi normal menyerupai lonceng, itulah sebabnya Anda mungkin melihat namanya kurva lonceng. Grafik tersebut memiliki “punuk” di tengah dan penurunan kepadatan yang tajam di tepinya. Inilah inti dari distribusi normal. Kemungkinan suatu variabel acak akan berada di dekat pusat jauh lebih tinggi dibandingkan dengan variabel acak yang menyimpang jauh dari pusat.

Gambar di atas menunjukkan dua area di bawah kurva Gaussian: biru dan hijau. Alasan, yaitu. Intervalnya sama untuk kedua bagian. Namun ketinggiannya sangat berbeda. Area biru terletak lebih jauh dari pusat dan memiliki ketinggian yang jauh lebih rendah dibandingkan area hijau yang terletak di tengah-tengah sebaran. Akibatnya, area, yaitu probabilitas untuk masuk ke dalam interval yang ditentukan, juga berbeda.

Rumus distribusi normal (densitas) adalah sebagai berikut.

Rumusnya terdiri dari dua konstanta matematika:

π – nomor pi 3.142;

e– basis logaritma natural 2,718;

dua parameter yang dapat diubah yang menentukan bentuk kurva tertentu:

M– ekspektasi matematis (notasi lain dapat digunakan dalam berbagai sumber, misalnya, µ atau A);

σ 2– penyebaran;

dan variabel itu sendiri X, yang kepadatan probabilitasnya dihitung.

Bentuk spesifik dari distribusi normal bergantung pada 2 parameter: ( M) Dan ( σ 2). Ditunjukkan secara singkat N(m, σ 2) atau N(m, σ). Parameter M(ekspektasi) menentukan pusat distribusi, yang sesuai dengan ketinggian maksimum grafik. Penyebaran σ 2 mencirikan ruang lingkup variasi, yaitu “kekotoran” data.

Parameter ekspektasi matematis menggeser pusat distribusi ke kanan atau kiri tanpa mempengaruhi bentuk kurva kepadatan itu sendiri.

Namun dispersi menentukan ketajaman kurva. Jika data mempunyai sebaran kecil, maka seluruh massanya terkonsentrasi di pusat. Jika data mempunyai sebaran yang besar, maka data tersebut “tersebar” dalam rentang yang luas.

Kepadatan distribusi tidak memiliki penerapan praktis langsung. Untuk menghitung probabilitas, Anda perlu mengintegrasikan fungsi kepadatan.

Probabilitas suatu variabel acak akan lebih kecil dari nilai tertentu X, ditentukan fungsi distribusi normal:

Dengan menggunakan sifat matematika dari distribusi kontinu apa pun, mudah untuk menghitung probabilitas lainnya

P(a ≤ X< b) = Ф(b) – Ф(a)

Distribusi normal standar

Distribusi normal bergantung pada parameter mean dan varians, itulah sebabnya sifat-sifatnya sulit terlihat. Alangkah baiknya jika memiliki standar distribusi yang tidak bergantung pada skala data. Dan itu ada. Ditelepon distribusi normal standar. Sebenarnya ini adalah distribusi normal biasa, hanya dengan parameter ekspektasi matematis 0 dan varians 1, ditulis singkat N(0, 1).

Distribusi normal apa pun dapat dengan mudah diubah menjadi distribusi standar dengan normalisasi:

Di mana z– variabel baru yang digunakan sebagai gantinya X;
M- nilai yang diharapkan;
σ - standar deviasi.

Untuk data sampel, perkiraan diambil:

Rata-rata aritmatika dan varians dari variabel baru z sekarang juga masing-masing 0 dan 1. Hal ini dapat dengan mudah diverifikasi menggunakan transformasi aljabar dasar.

Nama itu muncul dalam literatur skor-z. Ini dia – data yang dinormalisasi. Skor-Z dapat langsung dibandingkan dengan probabilitas teoritis, karena skalanya sesuai dengan standar.

Sekarang mari kita lihat seperti apa kepadatan distribusi normal standar (untuk skor-z). Izinkan saya mengingatkan Anda bahwa fungsi Gaussian memiliki bentuk:

Mari kita gantikan saja (xm)/σ surat z, dan sebagai gantinya σ – satu, kita mengerti fungsi kepadatan dari distribusi normal standar:

Grafik kepadatan:

Pusatnya, seperti yang diharapkan, berada di titik 0. Pada titik yang sama, fungsi Gaussian mencapai maksimumnya, yang sesuai dengan variabel acak yang menerima nilai rata-ratanya (yaitu x-m=0). Kepadatan pada titik ini adalah 0,3989, yang bahkan dapat dihitung di kepala Anda, karena e 0 =1 dan yang tersisa hanyalah menghitung perbandingan 1 dengan akar 2 pi.

Jadi, grafik dengan jelas menunjukkan bahwa nilai yang memiliki penyimpangan kecil dari rata-rata lebih sering muncul dibandingkan nilai lainnya, dan nilai yang sangat jauh dari pusat lebih jarang muncul. Skala sumbu x diukur dalam standar deviasi, yang memungkinkan Anda menghilangkan satuan pengukuran dan memperoleh struktur universal dengan distribusi normal. Kurva Gaussian untuk data yang dinormalisasi dengan sempurna menunjukkan sifat lain dari distribusi normal. Misalnya simetris terhadap sumbu ordinat. Sebagian besar nilai terkonsentrasi dalam ±1σ dari rata-rata aritmatika (kami memperkirakan dengan mata untuk saat ini). Sebagian besar data berada dalam ±2σ. Hampir semua data berada dalam ±3σ. Properti terakhir dikenal luas sebagai aturan tiga sigma untuk distribusi normal.

Fungsi distribusi normal standar memungkinkan Anda menghitung probabilitas.

Jelas tidak ada yang menghitung secara manual. Semuanya dihitung dan ditempatkan dalam tabel khusus, yang ada di akhir buku teks statistik mana pun.

Tabel distribusi normal

Ada dua jenis tabel distribusi normal:

- meja kepadatan;

- meja fungsi(integral kepadatan).

Meja kepadatan jarang digunakan. Namun, mari kita lihat tampilannya. Katakanlah kita perlu mendapatkan kepadatannya z = 1, yaitu kepadatan suatu nilai dipisahkan dari ekspektasi sebesar 1 sigma. Di bawah ini adalah bagian dari tabel.

Bergantung pada organisasi datanya, kami mencari nilai yang diinginkan berdasarkan nama kolom dan baris. Dalam contoh kita, kita mengambil garis 1,0 dan kolom 0 , Karena tidak ada yang seperseratus. Nilai yang Anda cari adalah 0,2420 (0 sebelum 2420 dihilangkan).

Fungsi Gaussian simetris terhadap ordinat. Itu sebabnya φ(z)= φ(-z), yaitu kepadatan untuk 1 identik dengan kepadatan untuk -1 , yang terlihat jelas pada gambar.

Untuk menghindari pemborosan kertas, tabel dicetak hanya untuk nilai positif.

Dalam prakteknya, nilai-nilai lebih sering digunakan fungsi distribusi normal standar, yaitu probabilitas berbeda z.

Tabel tersebut juga hanya berisi nilai positif. Oleh karena itu, untuk memahami dan menemukan setiap Anda harus mengetahui probabilitas yang diperlukan sifat-sifat distribusi normal standar.

Fungsi (z) simetris terhadap nilainya 0,5 (dan bukan sumbu ordinat, seperti kepadatan). Oleh karena itu persamaannya benar:

Fakta ini terlihat pada gambar:

Nilai fungsi (-z) Dan (z) bagilah grafik tersebut menjadi 3 bagian. Apalagi bagian atas dan bawahnya sama (ditunjukkan dengan tanda centang). Untuk melengkapi kemungkinan (z) ke 1, tambahkan saja nilai yang hilang (-z). Anda mendapatkan kesetaraan yang ditunjukkan tepat di atas.

Jika Anda perlu mencari kemungkinan jatuh ke dalam interval (0;z), yaitu peluang penyimpangan dari nol ke arah positif ke sejumlah simpangan baku tertentu, cukup dengan mengurangkan 0,5 dari nilai fungsi distribusi normal baku:

Untuk lebih jelasnya, Anda bisa melihat gambarnya.

Pada kurva Gaussian, situasi yang sama terlihat seperti luas dari tengah ke kanan z.

Seringkali, seorang analis tertarik pada kemungkinan penyimpangan di kedua arah dari nol. Dan karena fungsinya simetris terhadap pusat, maka rumus sebelumnya harus dikalikan 2:

Gambar di bawah.

Di bawah kurva Gaussian, ini adalah bagian tengah yang dibatasi oleh nilai yang dipilih –z kiri dan z di sebelah kanan.

Properti ini harus diperhitungkan, karena nilai yang ditabulasikan jarang sesuai dengan interval yang diinginkan.

Untuk mempermudah tugas, buku teks biasanya menerbitkan tabel fungsi dalam bentuk:

Jika Anda memerlukan probabilitas deviasi kedua arah dari nol, maka, seperti yang baru saja kita lihat, nilai tabel untuk fungsi ini cukup dikalikan dengan 2.

Sekarang mari kita lihat contoh spesifiknya. Di bawah ini adalah tabel distribusi normal baku. Mari kita cari nilai tabel untuk ketiganya z: 1,64, 1,96 dan 3.

Bagaimana memahami arti angka-angka ini? Mari kita mulai dengan z=1,64, yang nilai tabelnya 0,4495 . Cara termudah untuk menjelaskan artinya ada pada gambar.

Artinya, probabilitas bahwa variabel acak yang terstandarisasi dan terdistribusi normal berada dalam interval dari 0 sebelum 1,64 , sama 0,4495 . Saat menyelesaikan soal, biasanya Anda perlu menghitung probabilitas deviasi di kedua arah, jadi kalikan nilainya 0,4495 dengan 2 dan kita mendapatkan sekitar 0,9. Area yang ditempati di bawah kurva Gaussian ditunjukkan di bawah ini.

Dengan demikian, 90% dari semua nilai yang terdistribusi normal berada dalam interval tersebut ±1,64σ dari mean aritmatika. Bukan kebetulan saya memilih artinya z=1,64, Karena lingkungan di sekitar mean aritmatika, yang menempati 90% dari seluruh area, terkadang digunakan untuk menghitung interval kepercayaan. Jika nilai yang diuji tidak berada dalam area yang ditentukan, maka kecil kemungkinan terjadinya (hanya 10%).

Namun, untuk menguji hipotesis, interval yang mencakup 95% dari seluruh nilai lebih sering digunakan. Setengah peluangnya 0,95 - Ini 0,4750 (lihat nilai kedua yang disorot dalam tabel).

Untuk kemungkinan ini z=1,96. Itu. dalam waktu hampir ±2σ 95% nilainya berasal dari rata-rata. Hanya 5% yang berada di luar batas tersebut.

Nilai tabel lain yang menarik dan sering digunakan sesuai dengan z=3, itu sama menurut tabel kami 0,4986 . Kalikan dengan 2 dan dapatkan 0,997 . Jadi, di dalam ±3σ Hampir semua nilai diturunkan dari mean aritmatika.

Seperti inilah aturan 3 sigma untuk distribusi normal dalam diagram.

Dengan menggunakan tabel statistik, Anda bisa mendapatkan probabilitas apa pun. Namun, metode ini sangat lambat, tidak nyaman dan sudah ketinggalan jaman. Saat ini semuanya dilakukan di komputer. Selanjutnya kita beralih ke praktik perhitungan di Excel.

Distribusi Normal di Excel

Excel memiliki beberapa fungsi untuk menghitung probabilitas atau invers dari distribusi normal.

Fungsi DIST NORMAL

Fungsi NORM.ST.DIST. dirancang untuk menghitung kepadatan ϕ(z) atau probabilitas (z) menurut data yang dinormalisasi ( z).

=NORM.ST.DIST(z;integral)

z– nilai variabel standar

integral– jika 0, maka kepadatan dihitungϕ(z) , jika 1 adalah nilai fungsi Ф(z), mis. probabilitas P(Z

Mari kita hitung kepadatan dan nilai fungsi yang berbeda z: -3, -2, -1, 0, 1, 2, 3(kami akan menunjukkannya di sel A2).

Untuk menghitung massa jenis, Anda memerlukan rumus =NORM.ST.DIST(A2;0). Pada diagram di bawah, ini adalah titik merah.

Untuk menghitung nilai fungsi =NORM.ST.DIST(A2;1). Rajah menunjukkan kawasan yang diarsir di bawah lengkung normal.

Pada kenyataannya, lebih sering diperlukan untuk menghitung probabilitas bahwa suatu variabel acak tidak akan melampaui batas-batas tertentu dari rata-ratanya (dalam standar deviasi yang sesuai dengan variabel tersebut. z), yaitu P(|Z| .

Mari kita tentukan probabilitas suatu variabel acak berada dalam batas tersebut ±1z, ±2z dan ±3z dari nol. Butuh rumus 2Ф(z)-1, di Excel =2*NORM.ST.DIST(A2;1)-1.

Diagram dengan jelas menunjukkan sifat dasar utama dari distribusi normal, termasuk aturan tiga sigma. Fungsi NORM.ST.DIST. adalah tabel otomatis nilai fungsi distribusi normal di Excel.

Mungkin juga ada masalah sebaliknya: berdasarkan probabilitas yang tersedia P(Z temukan nilai standarnya z, yaitu kuantil dari distribusi normal standar.

Fungsi REV NORMAL

NORM.ST.REV menghitung kebalikan dari fungsi distribusi normal standar. Sintaksnya terdiri dari satu parameter:

=NORM.ST.REV(probabilitas)

kemungkinan adalah sebuah kemungkinan.

Rumus ini digunakan sesering rumus sebelumnya, karena dengan menggunakan tabel yang sama Anda tidak hanya harus mencari probabilitas, tetapi juga kuantil.

Misalnya, saat menghitung interval kepercayaan, probabilitas kepercayaan ditentukan, sesuai dengan nilai yang perlu dihitung z.

Mengingat selang kepercayaan terdiri dari batas atas dan batas bawah serta distribusi normalnya simetris di sekitar nol, maka cukup diperoleh batas atas (deviasi positif). Batas bawah diambil dengan tanda negatif. Mari kita nyatakan probabilitas kepercayaan sebagai γ (gamma), maka batas atas selang kepercayaan dihitung dengan menggunakan rumus berikut.

Mari kita hitung nilainya di Excel z(yang sesuai dengan deviasi dari rata-rata dalam sigma) untuk beberapa probabilitas, termasuk probabilitas yang diketahui oleh ahli statistik mana pun: 90%, 95%, dan 99%. Di sel B2 kami menunjukkan rumus: =NORM.ST.REV((1+A2)/2). Dengan mengubah nilai variabel (probabilitas di sel A2), kita memperoleh batas interval yang berbeda.

Interval kepercayaan 95% adalah 1,96, yaitu hampir 2 standar deviasi. Dari sini mudah, bahkan secara mental, untuk memperkirakan kemungkinan penyebaran variabel acak normal. Secara umum, interval kepercayaan 90%, 95%, dan 99% sesuai dengan interval kepercayaan ±1,64, ±1,96, dan ±2,58 σ.

Secara umum, fungsi NORM.ST.DIST dan NORM.ST.REV memungkinkan Anda melakukan penghitungan apa pun yang terkait dengan distribusi normal. Namun untuk mempermudah dan tidak ribet, Excel memiliki beberapa fitur lainnya. Misalnya, Anda dapat menggunakan CONFIDENCE NORM untuk menghitung interval kepercayaan mean. Untuk mengecek mean aritmatika ada rumus Z.TEST.

Mari kita lihat beberapa rumus berguna lainnya beserta contohnya.

Fungsi DIST NORMAL

Fungsi DASAR NORMAL. berbeda dari NORM.ST.DIST. hanya karena digunakan untuk memproses data dalam skala apa pun, dan bukan hanya data yang dinormalisasi. Parameter distribusi normal ditentukan dalam sintaks.

=NORM.DIST(x,rata-rata,deviasi_standar,integral)

rata-rata– ekspektasi matematis digunakan sebagai parameter pertama model distribusi normal

standar_mati– deviasi standar – parameter kedua model

integral– jika 0, maka massa jenis dihitung, jika 1 – maka nilai fungsinya, yaitu P(X

Misalnya, kepadatan untuk nilai 15, yang diekstraksi dari sampel normal dengan ekspektasi 10, deviasi standar 3, dihitung sebagai berikut:

Jika parameter terakhir disetel ke 1, maka kita memperoleh probabilitas bahwa variabel acak normal akan kurang dari 15 untuk parameter distribusi tertentu. Dengan demikian, probabilitas dapat dihitung langsung dari data aslinya.

Fungsi NORM.REV

Ini adalah kuantil dari distribusi normal, yaitu. nilai fungsi invers. Sintaksnya adalah sebagai berikut.

=NORM.REV(probabilitas,rata-rata,deviasi_standar)

kemungkinan- kemungkinan

rata-rata– ekspektasi matematis

standar_mati– deviasi standar

Tujuannya sama dengan NORM.ST.REV, hanya fungsi yang berfungsi dengan data dalam skala apa pun.

Contohnya ditunjukkan pada video di akhir artikel.

Pemodelan Distribusi Normal

Beberapa soal memerlukan pembangkitan bilangan acak normal. Tidak ada fungsi siap pakai untuk ini. Namun, Excel memiliki dua fungsi yang mengembalikan angka acak: KASUS ANTARA Dan RAND. Yang pertama menghasilkan bilangan bulat acak dan terdistribusi seragam dalam batas tertentu. Fungsi kedua menghasilkan bilangan acak yang terdistribusi seragam antara 0 dan 1. Untuk membuat sampel buatan dengan distribusi tertentu, Anda memerlukan fungsi tersebut RAND.

Misalkan untuk melakukan suatu percobaan perlu diperoleh sampel dari populasi yang berdistribusi normal dengan ekspektasi 10 dan simpangan baku 3. Untuk satu nilai acak, kita akan menulis rumus di Excel.

NORM.INV(RAND(),10,3)

Mari kita tingkatkan ke jumlah sel yang diperlukan dan sampel normal sudah siap.

Untuk memodelkan data standar, Anda harus menggunakan NORM.ST.REV.

Proses pengubahan bilangan seragam menjadi bilangan normal dapat ditunjukkan pada diagram berikut. Dari probabilitas seragam yang dihasilkan oleh rumus RAND, ditarik garis horizontal ke grafik fungsi distribusi normal. Kemudian, dari titik potong probabilitas dengan grafik, proyeksi diturunkan ke sumbu horizontal.



Apa lagi yang harus dibaca