Sự khác biệt là gì? Các biến thể tuyệt đối

Sự phân tán trong thống kêđược tìm thấy dưới dạng các giá trị riêng lẻ của đặc tính bình phương từ . Tùy thuộc vào dữ liệu ban đầu, nó được xác định bằng cách sử dụng các công thức phương sai đơn giản và có trọng số:

1. (đối với dữ liệu chưa được nhóm) được tính bằng công thức:

2. Phương sai có trọng số (đối với chuỗi biến thể):

trong đó n là tần số (độ lặp lại của hệ số X)

Ví dụ về tìm phương sai

Trang này mô tả một ví dụ tiêu chuẩn về việc tìm phương sai, bạn cũng có thể xem xét các vấn đề khác để tìm ra nó

Ví dụ 1. Dữ liệu sau đây có sẵn cho một nhóm 20 sinh viên tương ứng. Cần xây dựng chuỗi khoảng phân bố của đặc tính, tính giá trị trung bình của đặc tính và nghiên cứu độ phân tán của nó.

Hãy xây dựng một nhóm khoảng. Hãy xác định phạm vi của khoảng bằng công thức:

trong đó X max là giá trị lớn nhất của đặc tính nhóm;
X min - giá trị tối thiểu của đặc tính nhóm;
n – số khoảng:

Chúng tôi chấp nhận n=5. Bước là: h = (192 - 159)/ 5 = 6,6

Hãy tạo một nhóm khoảng

Để tính toán thêm, chúng tôi sẽ xây dựng một bảng phụ trợ:

X'i là giữa khoảng thời gian. (ví dụ: giữa khoảng 159 – 165,6 = 162,3)

Chúng tôi xác định chiều cao trung bình của học sinh bằng công thức tính trung bình cộng có trọng số:

Hãy xác định phương sai bằng công thức:

Công thức phân tán có thể được biến đổi như sau:

Từ công thức này suy ra rằng phương sai bằng sự khác biệt giữa mức trung bình của các bình phương của các lựa chọn và bình phương và mức trung bình.

Sự phân tán trong chuỗi biến thiên với các khoảng bằng nhau sử dụng phương pháp mômen có thể được tính theo cách sau bằng cách sử dụng thuộc tính phân tán thứ hai (chia tất cả các tùy chọn cho giá trị của khoảng). Xác định phương sai, được tính bằng phương pháp mômen, sử dụng công thức sau sẽ đỡ tốn công sức hơn:

trong đó i là giá trị của khoảng;
A là số 0 thông thường, thuận tiện khi sử dụng ở giữa khoảng có tần số cao nhất;
m1 là bình phương mômen bậc một;
m2 - thời điểm bậc hai

(nếu trong một quần thể thống kê, một đặc tính thay đổi theo cách chỉ có hai lựa chọn loại trừ lẫn nhau thì sự biến thiên đó được gọi là thay thế) có thể được tính bằng công thức:

Thay q = 1- p vào công thức phân tán này, ta thu được:

Các loại phương sai

Tổng phương saiđo lường sự biến đổi của một đặc điểm trên toàn bộ quần thể dưới tác động của tất cả các yếu tố gây ra sự biến đổi này. Nó bằng bình phương trung bình của độ lệch của các giá trị riêng lẻ của một đặc tính x so với giá trị trung bình tổng thể của x và có thể được định nghĩa là phương sai đơn giản hoặc phương sai có trọng số.

đặc trưng cho sự biến đổi ngẫu nhiên, tức là phần biến động do ảnh hưởng của các yếu tố không được tính đến và không phụ thuộc vào yếu tố-thuộc tính làm cơ sở của nhóm. Độ phân tán như vậy bằng bình phương trung bình của độ lệch của các giá trị riêng lẻ của thuộc tính trong nhóm X so với giá trị trung bình số học của nhóm và có thể được tính là độ phân tán đơn giản hoặc độ phân tán có trọng số.

Như vậy, đo lường phương sai trong nhóm sự biến đổi của một tính trạng trong một nhóm và được xác định theo công thức:

trong đó xi là giá trị trung bình của nhóm;
ni là số đơn vị trong nhóm.

Ví dụ, sự khác biệt trong nội bộ nhóm cần được xác định trong nhiệm vụ nghiên cứu ảnh hưởng của trình độ công nhân đến mức năng suất lao động trong phân xưởng cho thấy sự khác biệt về sản lượng của mỗi nhóm do tất cả các yếu tố có thể xảy ra (điều kiện kỹ thuật của thiết bị, tính sẵn có của dụng cụ, vật liệu, độ tuổi của công nhân, cường độ lao động, v.v.), ngoại trừ sự khác biệt về loại trình độ chuyên môn (trong một nhóm tất cả công nhân đều có trình độ chuyên môn như nhau).

Giá trị trung bình của phương sai trong nhóm phản ánh ngẫu nhiên, tức là phần biến thể xảy ra dưới ảnh hưởng của tất cả các yếu tố khác, ngoại trừ yếu tố nhóm. Nó được tính bằng công thức:

Đặc trưng cho sự biến đổi có hệ thống của đặc tính kết quả, do ảnh hưởng của dấu hiệu nhân tố tạo thành cơ sở của nhóm. Nó bằng bình phương trung bình của độ lệch của trung bình nhóm so với trung bình tổng thể. Phương sai giữa các nhóm được tính bằng công thức:

Quy tắc cộng phương sai trong thống kê

Dựa theo quy tắc cộng phương sai tổng phương sai bằng tổng trung bình của phương sai trong nhóm và giữa các nhóm:

Ý nghĩa của quy tắc này là tổng phương sai phát sinh dưới tác động của tất cả các yếu tố bằng tổng phương sai phát sinh dưới tác động của tất cả các yếu tố khác và phương sai phát sinh do yếu tố nhóm.

Sử dụng công thức cộng các phương sai, bạn có thể xác định phương sai chưa biết thứ ba từ hai phương sai đã biết, đồng thời đánh giá mức độ ảnh hưởng của đặc tính nhóm.

Đặc tính phân tán

1. Nếu tất cả các giá trị của một đặc tính bị giảm (tăng) một lượng không đổi như nhau thì độ phân tán sẽ không thay đổi.
2. Nếu tất cả các giá trị của một đặc tính đều giảm (tăng) cùng một số lần n thì phương sai sẽ giảm (tăng) tương ứng n^2 lần.

Nếu chia quần thể thành các nhóm theo đặc điểm đang nghiên cứu thì có thể tính các loại phương sai sau cho quần thể này: tổng, nhóm (trong nhóm), trung bình của nhóm (trung bình của nhóm), giữa các nhóm.

Ban đầu, nó tính toán hệ số xác định, hệ số này cho thấy phần nào trong tổng biến thể của tính trạng đang được nghiên cứu là biến thể giữa các nhóm, tức là. do đặc điểm nhóm:

Mối quan hệ tương quan thực nghiệm đặc trưng cho sự chặt chẽ của mối liên hệ giữa nhóm (giai thừa) và đặc điểm hiệu suất.

Tỷ lệ tương quan thực nghiệm có thể lấy giá trị từ 0 đến 1.

Để đánh giá mức độ gần gũi của kết nối dựa trên tỷ lệ tương quan thực nghiệm, bạn có thể sử dụng quan hệ Chaddock:

Ví dụ 4. Dữ liệu sau đây có sẵn về hiệu suất công việc của các tổ chức thiết kế và khảo sát thuộc nhiều hình thức sở hữu khác nhau:

Định nghĩa:

1) tổng phương sai;

2) phương sai nhóm;

3) giá trị trung bình của các phương sai nhóm;

4) phương sai giữa các nhóm;

5) tổng phương sai dựa trên quy tắc cộng phương sai;


6) hệ số xác định và hệ số tương quan thực nghiệm.

Đi đến kết luận.

Giải pháp:

1. Xác định khối lượng công việc trung bình do doanh nghiệp thực hiện thuộc hai hình thức sở hữu:

Hãy tính tổng phương sai:

2. Xác định điểm trung bình của nhóm:

triệu rúp;

triệu rúp

Phương sai nhóm:

;

3. Tính trung bình các phương sai nhóm:

4. Hãy xác định phương sai giữa các nhóm:

5. Tính phương sai tổng theo quy tắc cộng phương sai:

6. Hãy xác định hệ số xác định:

.

Như vậy, khối lượng công việc do tổ chức thiết kế, khảo sát thực hiện phụ thuộc 22% vào hình thức sở hữu của doanh nghiệp.

Tỷ lệ tương quan thực nghiệm được tính bằng công thức

.

Giá trị của chỉ tiêu tính toán cho thấy sự phụ thuộc của khối lượng công việc vào hình thức sở hữu của doanh nghiệp là nhỏ.

Ví dụ 5. Qua khảo sát trình độ công nghệ của các khu vực sản xuất, chúng tôi thu được số liệu sau:

Xác định hệ số xác định

Thông thường trong thống kê, khi phân tích một hiện tượng hoặc quá trình, không chỉ cần tính đến thông tin về mức trung bình của các chỉ số đang được nghiên cứu mà còn phải tính đến phân tán hoặc biến đổi giá trị của các đơn vị riêng lẻ , đó là một đặc điểm quan trọng của dân số đang được nghiên cứu.

Những yếu tố có thể thay đổi nhiều nhất là giá cổ phiếu, cung cầu và lãi suất trong những khoảng thời gian khác nhau và ở những nơi khác nhau.

Các chỉ số chính đặc trưng cho sự biến động , là phạm vi, độ phân tán, độ lệch chuẩn và hệ số biến thiên.

Phạm vi biến đổi biểu thị sự khác biệt giữa giá trị tối đa và tối thiểu của đặc tính: R = Xmax – Xmin. Nhược điểm của chỉ báo này là nó chỉ đánh giá các ranh giới biến đổi của một đặc điểm và không phản ánh sự biến đổi của nó trong các ranh giới này.

phân tán thiếu khuyết điểm này. Nó được tính bằng bình phương độ lệch trung bình của các giá trị đặc trưng so với giá trị trung bình của chúng:

Một cách đơn giản để tính toán phương sai được thực hiện bằng các công thức sau (đơn giản và có trọng số):

Ví dụ về việc áp dụng các công thức này được trình bày trong nhiệm vụ 1 và 2.

Một chỉ số được sử dụng rộng rãi trong thực tế là độ lệch chuẩn :

Độ lệch chuẩn được định nghĩa là căn bậc hai của phương sai và có cùng thứ nguyên với đặc tính đang được nghiên cứu.

Các chỉ báo được xem xét cho phép chúng tôi thu được giá trị tuyệt đối của biến thể, tức là. đánh giá nó theo đơn vị đo của đặc tính đang được nghiên cứu. Không giống như họ, hệ số biến thiên đo lường sự biến thiên về mặt tương đối - so với mức trung bình, trong nhiều trường hợp là thích hợp hơn.

Công thức tính hệ số biến thiên.

Ví dụ giải bài tập về chủ đề “Các chỉ số biến thiên trong thống kê”

Vấn đề 1 . Khi nghiên cứu ảnh hưởng của quảng cáo đến quy mô tiền gửi trung bình hàng tháng tại các ngân hàng trong khu vực, 2 ngân hàng đã được kiểm tra. Đây là kết quả đạt được:

Định nghĩa:
1) đối với mỗi ngân hàng: a) tiền gửi bình quân mỗi tháng; b) phân tán đóng góp;
2) số tiền gửi bình quân hàng tháng của hai ngân hàng cộng lại;
3) Chênh lệch tiền gửi của 2 ngân hàng, tùy theo quảng cáo;
4) Chênh lệch tiền gửi của 2 ngân hàng, tùy thuộc vào tất cả các yếu tố ngoại trừ quảng cáo;
5) Tổng phương sai sử dụng quy tắc cộng;
6) Hệ số xác định;
7) Mối quan hệ tương quan.

Giải pháp

1) Hãy lập bảng tính cho ngân hàng có quảng cáo . Để xác định số tiền gửi trung bình hàng tháng, chúng ta sẽ tìm điểm giữa của các khoảng thời gian. Trong trường hợp này, giá trị của khoảng mở (khoảng thứ nhất) có điều kiện tương đương với giá trị của khoảng liền kề với nó (khoảng thứ hai).

Chúng ta sẽ tìm kích thước tiền gửi trung bình bằng cách sử dụng công thức trung bình số học có trọng số:

29.000/50 = 580 chà.

Chúng tôi tìm thấy phương sai của đóng góp bằng công thức:

23 400/50 = 468

Chúng tôi sẽ thực hiện các hành động tương tự cho một ngân hàng không có quảng cáo :

2) Hãy cùng nhau tìm quy mô tiền gửi trung bình của hai ngân hàng. Хср =(580×50+542,8×50)/100 = 561,4 chà.

3) Chúng ta sẽ tìm phương sai tiền gửi của hai ngân hàng, tùy thuộc vào quảng cáo, sử dụng công thức: σ 2 =pq (công thức tính phương sai của một thuộc tính thay thế). Ở đây p=0,5 là tỷ lệ các yếu tố phụ thuộc vào quảng cáo; q=1-0,5 thì σ 2 =0,5*0,5=0,25.

4) Vì tỷ trọng của các yếu tố khác là 0,5 nên phương sai của khoản tiền gửi của hai ngân hàng, tùy thuộc vào tất cả các yếu tố ngoại trừ quảng cáo, cũng là 0,25.

5) Xác định tổng phương sai bằng quy tắc cộng.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 = σ 2 thực tế + σ 2 phần còn lại = 552,08+345,96 = 898,04

6) Hệ số xác định η 2 = σ 2 thực tế / σ 2 = 345,96/898,04 = 0,39 = 39% - quy mô đóng góp phụ thuộc vào quảng cáo 39%.

7) Hệ số tương quan thực nghiệm η = √η 2 = √0,39 = 0,62 – mối quan hệ khá chặt chẽ.

Vấn đề 2 . Có một số nhóm doanh nghiệp theo quy mô của sản phẩm có thể bán được:

Xác định: 1) sự phân tán giá trị của sản phẩm có thể bán được trên thị trường; 2) độ lệch chuẩn; 3) hệ số biến thiên.

Giải pháp

1) Theo điều kiện, một chuỗi phân phối theo khoảng được trình bày. Nó phải được biểu thị một cách riêng biệt, nghĩa là tìm phần giữa của khoảng (x"). Trong các nhóm khoảng đóng, chúng ta tìm phần giữa bằng cách sử dụng trung bình số học đơn giản. Trong các nhóm có giới hạn trên - là hiệu giữa giới hạn trên này và một nửa kích thước của khoảng tiếp theo (200-(400 -200):2=100).

Trong các nhóm có giới hạn dưới - tổng của giới hạn dưới này và một nửa kích thước của khoảng trước đó (800+(800-600):2=900).

Chúng tôi tính giá trị trung bình của các sản phẩm có thể bán được trên thị trường bằng công thức:

Хср = k×((Σ((x"-a):k)×f):Σf)+a. Ở đây a=500 là kích thước của quyền chọn ở tần suất cao nhất, k=600-400=200 là kích thước của khoảng ở tần số cao nhất Hãy đưa kết quả vào bảng:

Vì vậy, giá trị trung bình của sản lượng thương mại trong giai đoạn nghiên cứu thường bằng Хср = (-5:37)×200+500=472,97 nghìn rúp.

2) Chúng tôi tìm phương sai bằng công thức sau:

σ 2 = (33/37)*2002-(472,97-500)2 = 35.675,67-730,62 = 34.945,05

3) độ lệch chuẩn: σ = ±√σ 2 = ±√34.945,05 ≈ ±186,94 nghìn rúp.

4) hệ số biến thiên: V = (σ /Хср)*100 = (186,94 / 472,97)*100 = 39,52%

Cùng với việc nghiên cứu sự biến đổi của một đặc điểm trong toàn bộ quần thể nói chung, thường cần phải theo dõi những thay đổi về số lượng trong đặc điểm giữa các nhóm mà quần thể được phân chia, cũng như giữa các nhóm. Nghiên cứu về sự biến thiên này đạt được bằng cách tính toán và phân tích các loại phương sai khác nhau.
Có phương sai tổng thể, phương sai giữa các nhóm và phương sai nội nhóm.
Tổng phương sai σ 2đo lường sự biến đổi của một tính trạng trong toàn bộ quần thể dưới tác động của tất cả các yếu tố gây ra sự biến đổi này.

Phương sai giữa các nhóm (δ) đặc trưng cho biến thể hệ thống, tức là sự khác biệt về giá trị của đặc điểm được nghiên cứu phát sinh dưới ảnh hưởng của đặc điểm nhân tố tạo thành cơ sở của nhóm. Nó được tính bằng công thức:
.

Phương sai trong nhóm (σ) phản ánh sự thay đổi ngẫu nhiên, tức là một phần của biến thể xảy ra dưới tác động của các yếu tố không được tính toán và không phụ thuộc vào thuộc tính yếu tố tạo thành cơ sở của nhóm. Nó được tính theo công thức:
.

Trung bình của phương sai trong nhóm: .

Có một quy luật kết nối 3 loại phân tán. Tổng phương sai bằng tổng giá trị trung bình của phương sai trong nhóm và giữa các nhóm: .
Tỷ lệ này được gọi là quy tắc cộng phương sai.

Một chỉ báo được sử dụng rộng rãi trong phân tích là tỷ lệ phương sai giữa các nhóm trong tổng phương sai. Nó được gọi là hệ số xác định thực nghiệm (η 2): .
Căn bậc hai của hệ số xác định thực nghiệm được gọi là tỷ lệ tương quan thực nghiệm (η):
.
Nó mô tả ảnh hưởng của đặc tính tạo thành cơ sở của nhóm đối với sự biến đổi của đặc tính thu được. Tỷ lệ tương quan thực nghiệm nằm trong khoảng từ 0 đến 1.
Chúng ta hãy chứng minh cách sử dụng thực tế của nó bằng ví dụ sau (Bảng 1).

Ví dụ số 1. Bảng 1 - Năng suất lao động của hai nhóm công nhân tại một phân xưởng của NPO “Cyclone”

Hãy tính giá trị trung bình và phương sai tổng thể và nhóm:




Số liệu ban đầu để tính trung bình phương sai trong nhóm và giữa các nhóm được trình bày trong bảng. 2.
ban 2
Tính toán và δ 2 cho hai nhóm công nhân.


Nhóm công nhân
Số lượng công nhân, người Trung bình, trẻ/ca phân tán

Đã hoàn thành khóa đào tạo kỹ thuật

5 95 42,0

Những người chưa hoàn thành khóa đào tạo kỹ thuật

5 81 231,2

Tất cả công nhân

10 88 185,6
Hãy tính toán các chỉ số. Trung bình của phương sai trong nhóm:
.
Phương sai giữa các nhóm

Tổng phương sai:
Như vậy, hệ số tương quan thực nghiệm: .

Cùng với sự thay đổi về đặc tính số lượng, sự thay đổi về đặc tính định tính cũng có thể được quan sát thấy. Nghiên cứu về sự biến thiên này đạt được bằng cách tính toán các loại phương sai sau:

Sự phân tán cổ phần trong nhóm được xác định theo công thức

Ở đâu và tôi– số lượng đơn vị trong các nhóm riêng biệt.
Tỷ lệ đặc điểm được nghiên cứu trong toàn bộ dân số, được xác định theo công thức:
Ba loại phương sai có liên quan với nhau như sau:
.

Mối quan hệ phương sai này được gọi là định lý cộng các phương sai của các đặc điểm.

Các chỉ số tổng quát chính của sự thay đổi trong số liệu thống kê là độ phân tán và độ lệch chuẩn.

phân tán cái này trung bình số học bình phương độ lệch của từng giá trị đặc trưng so với mức trung bình tổng thể. Phương sai thường được gọi là bình phương trung bình của độ lệch và được ký hiệu là  2. Tùy thuộc vào dữ liệu nguồn, phương sai có thể được tính bằng cách sử dụng trung bình số học đơn giản hoặc trọng số:

 phương sai không trọng số (đơn giản);

 trọng số phương sai.

Độ lệch chuẩn đây là đặc điểm tổng quát của kích thước tuyệt đối biến thể dấu hiệu trong tổng thể. Nó được thể hiện bằng cùng đơn vị đo lường với thuộc tính (tính bằng mét, tấn, phần trăm, ha, v.v.).

Độ lệch chuẩn là căn bậc hai của phương sai và được ký hiệu là :

- độ lệch chuẩn không có trọng số;

 độ lệch chuẩn có trọng số.

Độ lệch chuẩn là thước đo độ tin cậy của giá trị trung bình. Độ lệch chuẩn càng nhỏ thì giá trị trung bình số học phản ánh toàn bộ tổng thể được đại diện càng tốt.

Việc tính toán độ lệch chuẩn được thực hiện trước bằng việc tính toán phương sai.

Quy trình tính phương sai có trọng số như sau:

1) xác định giá trị trung bình số học có trọng số:

2) tính toán độ lệch của các tùy chọn so với mức trung bình:

3) bình phương độ lệch của từng tùy chọn so với mức trung bình:

4) nhân bình phương độ lệch với trọng số (tần số):

5) tóm tắt các sản phẩm thu được:

6) số tiền thu được được chia cho tổng các trọng số:

Ví dụ 2.1

Hãy tính trung bình số học có trọng số:

Các giá trị độ lệch so với giá trị trung bình và bình phương của chúng được trình bày trong bảng. Hãy xác định phương sai:

Độ lệch chuẩn sẽ bằng:

Nếu dữ liệu nguồn được trình bày dưới dạng khoảng chuỗi phân phối , thì trước tiên bạn cần xác định giá trị rời rạc của thuộc tính, sau đó áp dụng phương thức được mô tả.

Ví dụ 2.2

Chúng ta hãy trình bày cách tính phương sai cho một chuỗi khoảng bằng cách sử dụng dữ liệu về phân bổ diện tích gieo trồng của một trang trại tập thể theo năng suất lúa mì.

Trung bình số học là:

Hãy tính phương sai:

6.3. Tính toán phương sai bằng công thức dựa trên dữ liệu riêng lẻ

Kỹ thuật tính toán phương sai phức tạp và với các giá trị tùy chọn và tần số lớn, nó có thể cồng kềnh. Tính toán có thể được đơn giản hóa bằng cách sử dụng các tính chất của sự phân tán.

Sự phân tán có các tính chất sau.

1. Việc giảm hoặc tăng trọng số (tần số) của một đặc tính thay đổi theo một số lần nhất định không làm thay đổi độ phân tán.

2. Giảm hoặc tăng từng giá trị của đặc tính một lượng không đổi MỘT không làm thay đổi độ phân tán.

3. Giảm hoặc tăng từng giá trị của đặc tính theo một số lần nhất định k tương ứng làm giảm hoặc tăng phương sai trong k 2 lần độ lệch chuẩn  trong k một lần.

4. Độ phân tán của một đặc tính so với một giá trị tùy ý luôn lớn hơn độ phân tán so với trung bình số học trên bình phương của hiệu giữa giá trị trung bình và giá trị tùy ý:

Nếu như MỘT 0 thì ta thu được đẳng thức sau:

nghĩa là phương sai của đặc tính bằng hiệu giữa bình phương trung bình của các giá trị đặc trưng và bình phương của giá trị trung bình.

Mỗi thuộc tính có thể được sử dụng độc lập hoặc kết hợp với các thuộc tính khác khi tính toán phương sai.

Quy trình tính phương sai rất đơn giản:

1) xác định trung bình số học :

2) bình phương giá trị trung bình số học:

3) bình phương độ lệch của từng biến thể của chuỗi:

X Tôi 2 .

4) tìm tổng bình phương của các phương án:

5) chia tổng bình phương của các tùy chọn cho số của chúng, tức là xác định bình phương trung bình:

6) xác định sự khác biệt giữa bình phương trung bình của đặc tính và bình phương của giá trị trung bình:

Ví dụ 3.1 Các dữ liệu sau đây có sẵn về năng suất của công nhân:

Hãy thực hiện các phép tính sau: