Chuỗi phân phối thống kê. Hãy xây dựng một chuỗi phân phối thống kê

Nhóm- đây là sự phân chia dân số thành các nhóm đồng nhất theo một số đặc điểm.

Mục đích của dịch vụ. Sử dụng máy tính trực tuyến, bạn có thể:

  • xây dựng một chuỗi biến thể, xây dựng biểu đồ và đa giác;
  • tìm các chỉ số biến đổi (trung bình, chế độ (bao gồm cả đồ họa), trung vị, phạm vi biến đổi, tứ phân vị, thập phân vị, hệ số phân biệt tứ phân vị, hệ số biến thiên và các chỉ số khác);

Hướng dẫn. Để nhóm một chuỗi, bạn phải chọn loại chuỗi biến thể thu được (riêng biệt hoặc khoảng) và cho biết lượng dữ liệu (số hàng). Giải pháp thu được được lưu trong tệp Word (xem ví dụ về nhóm dữ liệu thống kê).

Số lượng dữ liệu đầu vào
",0);">

Nếu việc phân nhóm đã được thực hiện và chuỗi biến thiên rời rạc hoặc chuỗi khoảng, thì bạn cần sử dụng máy tính trực tuyến Chỉ số biến thể. Kiểm định giả thuyết về kiểu phân phốiđược thực hiện bằng cách sử dụng dịch vụ Nghiên cứu hình thức phân phối.

Các loại nhóm thống kê

Chuỗi biến thể. Trong trường hợp quan sát một biến ngẫu nhiên rời rạc, có thể gặp cùng một giá trị nhiều lần. Các giá trị x i như vậy của một biến ngẫu nhiên được ghi lại cho biết n i là số lần nó xuất hiện trong n quan sát, đây chính là tần suất của giá trị này.
Trong trường hợp biến ngẫu nhiên liên tục, việc nhóm được sử dụng trong thực tế.
  1. Phân nhóm theo kiểu chữ- đây là sự phân chia dân số không đồng nhất về chất được nghiên cứu thành các tầng lớp, loại hình kinh tế - xã hội, các nhóm đơn vị đồng nhất. Để xây dựng nhóm này, hãy sử dụng tham số Chuỗi biến thể rời rạc.
  2. Một nhóm được gọi là cấu trúc, trong đó một quần thể đồng nhất được chia thành các nhóm đặc trưng cho cấu trúc của nó theo một số đặc điểm khác nhau. Để xây dựng nhóm này, hãy sử dụng tham số Chuỗi khoảng thời gian.
  3. Một nhóm bộc lộ mối quan hệ giữa các hiện tượng đang được nghiên cứu và đặc điểm của chúng được gọi là nhóm phân tích(xem phân tích nhóm chuỗi).

Nguyên tắc xây dựng nhóm thống kê

Một chuỗi các quan sát được sắp xếp theo thứ tự tăng dần được gọi là chuỗi biến thiên. Tính năng nhóm là một đặc điểm mà theo đó một quần thể được chia thành các nhóm riêng biệt. Nó được gọi là cơ sở của nhóm. Việc phân nhóm có thể dựa trên cả đặc điểm số lượng và chất lượng.
Sau khi xác định cơ sở của việc phân nhóm, cần quyết định câu hỏi về số lượng nhóm mà dân số đang nghiên cứu nên được chia vào.

Khi sử dụng máy tính cá nhân để xử lý dữ liệu thống kê, việc nhóm các đơn vị đối tượng được thực hiện bằng các quy trình chuẩn.
Một quy trình như vậy dựa trên việc sử dụng công thức Sturgess để xác định số lượng nhóm tối ưu:

k = 1+3,322*log(N)

Trong đó k là số nhóm, N là số đơn vị dân số.

Độ dài của các khoảng từng phần được tính như h=(x max -x min)/k

Sau đó, số lượng quan sát rơi vào các khoảng này sẽ được tính, được lấy dưới dạng tần số ni . Rất ít tần số có giá trị nhỏ hơn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Giá trị ở giữa của các khoảng x i =(c i-1 +c i)/2 được lấy làm giá trị mới.

Chúng được trình bày dưới dạng chuỗi phân phối và được trình bày dưới dạng.

Một chuỗi phân phối là một trong những loại nhóm.

Phạm vi phân phối- thể hiện sự phân bố có trật tự của các đơn vị tổng thể đang được nghiên cứu thành các nhóm theo một đặc điểm khác nhau nhất định.

Tùy thuộc vào đặc điểm cơ bản của sự hình thành chuỗi phân phối, chúng được phân biệt thuộc tính và biến thể hàng phân phối:

  • Thuộc tính- được gọi là chuỗi phân phối được xây dựng theo đặc tính định tính.
  • Chuỗi phân phối được xây dựng theo thứ tự tăng dần hoặc giảm dần các giá trị của đặc tính định lượng được gọi là biến thiên.
Chuỗi biến thể của phân phối bao gồm hai cột:

Cột đầu tiên cung cấp các giá trị định lượng của đặc tính khác nhau, được gọi là tùy chọn và được chỉ định. Tùy chọn rời rạc - được biểu thị dưới dạng số nguyên. Tùy chọn khoảng thời gian dao động từ và đến. Tùy thuộc vào loại tùy chọn, bạn có thể xây dựng một chuỗi biến thể rời rạc hoặc theo khoảng thời gian.
Cột thứ hai chứa số tùy chọn cụ thể, được biểu thị dưới dạng tần số hoặc tần số:

Tần số- đây là những con số tuyệt đối, hiển thị số lần xuất hiện một giá trị nhất định của một đặc tính trong tổng hợp, biểu thị . Tổng của tất cả các tần số phải bằng số lượng đơn vị trong toàn bộ quần thể.

Tần số() là tần số được biểu thị bằng phần trăm của tổng số. Tổng của tất cả các tần số được biểu thị bằng phần trăm phải bằng 100% theo phân số của một.

Biểu diễn đồ họa của chuỗi phân phối

Chuỗi phân phối được trình bày trực quan bằng hình ảnh đồ họa.

Chuỗi phân phối được mô tả như sau:
  • Đa giác
  • Biểu đồ
  • tích lũy
  • Ogives

Đa giác

Khi xây dựng một đa giác, các giá trị của đặc tính thay đổi được vẽ trên trục hoành (trục x) và tần số hoặc tần số được vẽ trên trục tung (trục y).

Đa giác trong hình. 6.1 dựa trên dữ liệu từ cuộc điều tra dân số vi mô của Nga năm 1994.

6.1. Phân bổ quy mô hộ gia đình

Tình trạng: Dữ liệu được cung cấp về việc phân bổ 25 nhân viên của một trong các doanh nghiệp theo các loại biểu thuế:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Nhiệm vụ: Xây dựng một chuỗi biến thể rời rạc và mô tả nó bằng đồ họa dưới dạng đa giác phân phối.
Giải pháp:
Trong ví dụ này, các tùy chọn là mức lương của nhân viên. Để xác định tần suất, cần tính số lượng nhân viên với loại biểu giá tương ứng.

Đa giác được sử dụng cho chuỗi biến thể rời rạc.

Để xây dựng một đa giác phân phối (Hình 1), chúng tôi vẽ các giá trị định lượng của các đặc tính khác nhau—các tùy chọn—trên trục hoành độ (X) và tần số hoặc tần số trên trục tọa độ.

Nếu các giá trị của một đặc tính được biểu thị dưới dạng các khoảng thì chuỗi đó được gọi là khoảng.
Chuỗi khoảng phân phối được mô tả bằng đồ họa dưới dạng biểu đồ, tích lũy hoặc ogive.

Bảng thống kê

Tình trạng: Dữ liệu được cung cấp về quy mô tiền gửi của 20 cá nhân trong một ngân hàng (nghìn rúp) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Nhiệm vụ: Xây dựng chuỗi biến thiên khoảng với các khoảng bằng nhau.
Giải pháp:

  1. Quần thể ban đầu bao gồm 20 đơn vị (N = 20).
  2. Sử dụng công thức Sturgess, chúng tôi xác định số lượng nhóm cần thiết được sử dụng: n=1+3.322*lg20=5
  3. Hãy tính giá trị của khoảng bằng nhau: i=(152 - 2) /5 = 30 nghìn rúp
  4. Hãy chia dân số ban đầu thành 5 nhóm với khoảng cách 30 nghìn rúp.
  5. Chúng tôi trình bày kết quả phân nhóm vào bảng:

Với việc ghi đặc tính liên tục như vậy, khi cùng một giá trị xuất hiện hai lần (là giới hạn trên của một khoảng và giới hạn dưới của khoảng khác), thì giá trị này thuộc về nhóm trong đó giá trị này đóng vai trò là giới hạn trên.

biểu đồ cột

Để xây dựng biểu đồ, các giá trị ranh giới của các khoảng được biểu thị trên trục abscissa và dựa trên chúng, các hình chữ nhật được xây dựng, chiều cao của nó tỷ lệ thuận với tần số (hoặc tần số).

Trong bộ lễ phục. 6.2. cho thấy biểu đồ phân bố dân số Nga năm 1997 theo nhóm tuổi.

Cơm. 6.2. Phân bố dân số Nga theo nhóm tuổi

Tình trạng: Việc phân bổ 30 nhân viên của công ty theo mức lương hàng tháng được đưa ra

Nhiệm vụ: Hiển thị chuỗi biến thiên theo khoảng thời gian bằng đồ họa dưới dạng biểu đồ và tích lũy.
Giải pháp:

  1. Ranh giới chưa xác định của khoảng mở (đầu tiên) được xác định bởi giá trị của khoảng thứ hai: 7000 - 5000 = 2000 rúp. Với cùng một giá trị, chúng tôi tìm thấy giới hạn dưới của khoảng đầu tiên: 5000 - 2000 = 3000 rúp.
  2. Để xây dựng biểu đồ trong hệ tọa độ hình chữ nhật, chúng ta vẽ dọc theo trục hoành các đoạn có giá trị tương ứng với các khoảng của chuỗi giãn tĩnh mạch.
    Các đoạn này đóng vai trò là đáy dưới và tần số (tần số) tương ứng đóng vai trò là chiều cao của hình chữ nhật được tạo thành.
  3. Hãy xây dựng một biểu đồ:

Để xây dựng các tích lũy cần tính toán các tần số (tần số) tích lũy. Chúng được xác định bằng cách tổng hợp tuần tự các tần số (tần số) của các khoảng trước đó và được ký hiệu là S. Tần số tích lũy cho biết có bao nhiêu đơn vị dân số có giá trị đặc trưng không lớn hơn giá trị đang được xem xét.

tích lũy

Sự phân bố của một đặc tính trong chuỗi biến thiên theo các tần số (tần số) tích lũy được mô tả bằng cách sử dụng phép tính tích lũy.

tích lũy hoặc một đường cong tích lũy, không giống như đa giác, được xây dựng từ các tần số hoặc tần số tích lũy. Trong trường hợp này, các giá trị của đặc tính được đặt trên trục abscissa và tần số hoặc tần số tích lũy được đặt trên trục tọa độ (Hình 6.3).

Cơm. 6.3. Tổng hợp phân bổ quy mô hộ gia đình

4. Hãy tính tần số tích lũy:
Tần số tích lũy của khoảng đầu tiên được tính như sau: 0 + 4 = 4, đối với khoảng thứ hai: 4 + 12 = 16; đối với số thứ ba: 4 + 12 + 8 = 24, v.v.

Khi xây dựng tích lũy, tần số (tần số) tích lũy của khoảng tương ứng được gán cho giới hạn trên của nó:

Ogiva

Ogivađược xây dựng tương tự như tích lũy với điểm khác biệt duy nhất là tần số tích lũy được đặt trên trục hoành và các giá trị đặc tính được đặt trên trục tọa độ.

Một loại tích lũy là đường cong nồng độ hoặc biểu đồ Lorentz. Để xây dựng đường cong nồng độ, thang đo tỷ lệ phần trăm từ 0 đến 100 được vẽ trên cả hai trục của hệ tọa độ hình chữ nhật, đồng thời, tần số tích lũy được biểu thị trên trục abscissa và các giá trị tích lũy của phần (tính theo phần trăm) theo thể tích của đặc tính được biểu thị trên trục tọa độ.

Sự phân bố đồng đều của đặc tính tương ứng với đường chéo của hình vuông trên đồ thị (Hình 6.4). Với sự phân bố không đồng đều, đồ thị biểu thị một đường cong lõm tùy thuộc vào mức độ tập trung của tính trạng.

6.4. Đường cong nồng độ

2. Khái niệm về chuỗi phân phối Chuỗi phân phối rời rạc và khoảng thời gian

Hàng phân phốiđược gọi là nhóm thuộc loại đặc biệt trong đó đối với từng đặc tính, nhóm đặc điểm hoặc loại đặc điểm, số lượng đơn vị trong nhóm hoặc tỷ lệ của số này trong tổng số được biết đến. Những thứ kia. chuỗi phân phối– một tập hợp các giá trị thuộc tính được sắp xếp theo thứ tự tăng dần hoặc giảm dần với trọng số tương ứng của chúng. Chuỗi phân phối có thể được xây dựng bằng các đặc điểm định lượng hoặc thuộc tính.

Chuỗi phân phối được xây dựng trên cơ sở định lượng được gọi là chuỗi biến thể. họ đang rời rạc và khoảng. Một chuỗi phân phối có thể được xây dựng dựa trên một đặc tính thay đổi liên tục (khi đặc tính đó có thể nhận bất kỳ giá trị nào trong bất kỳ khoảng nào) và trên một đặc tính thay đổi riêng biệt (cần các giá trị nguyên được xác định nghiêm ngặt).

rời rạc Chuỗi biến thể của phân phối là tập hợp các tùy chọn được xếp hạng với tần suất hoặc thông tin cụ thể tương ứng. Các biến thể của một chuỗi rời rạc là các giá trị thay đổi liên tục một cách rời rạc của một đặc tính, thường là kết quả của một phép đếm.

rời rạc

Chuỗi biến thiên thường được xây dựng nếu các giá trị của đặc tính đang được nghiên cứu có thể khác nhau ít nhất một lượng hữu hạn nhất định. Trong chuỗi rời rạc, các giá trị điểm của một đặc tính được chỉ định. Ví dụ : Phân bổ số lượng vest nam được các cửa hàng bán ra mỗi tháng theo kích cỡ.

Khoảng thời gian

Chuỗi biến thể là một tập hợp có thứ tự các khoảng thay đổi giá trị của một biến ngẫu nhiên với tần số hoặc tần số tương ứng của các giá trị của biến rơi vào từng biến đó. Chuỗi khoảng được thiết kế để phân tích sự phân bố của một đặc tính thay đổi liên tục, giá trị của nó thường được ghi lại bằng phép đo hoặc cân. Các biến thể của một chuỗi như vậy là các nhóm.

Ví dụ : Phân bổ số lượng mua hàng tại cửa hàng tạp hóa theo số lượng.

Nếu trong chuỗi biến thể rời rạc, đáp ứng tần số liên quan trực tiếp đến một biến thể của chuỗi, thì trong chuỗi khoảng, nó đề cập đến một nhóm biến thể.

Thật thuận tiện khi phân tích chuỗi phân phối bằng cách sử dụng biểu diễn đồ họa của chúng, điều này cho phép người ta đánh giá hình dạng của phân phối và các mẫu. Một chuỗi rời rạc được mô tả trên biểu đồ dưới dạng một đường đứt nét - đa giác phân phối. Để xây dựng nó, trong một hệ tọa độ hình chữ nhật, các giá trị được xếp hạng (có thứ tự) của đặc tính khác nhau được vẽ dọc theo trục hoành trên cùng một tỷ lệ và thang đo biểu thị tần số được vẽ dọc theo trục tọa độ.

Chuỗi khoảng được mô tả là biểu đồ phân phối(nghĩa là biểu đồ thanh).

Khi xây dựng biểu đồ, các giá trị của các khoảng được vẽ trên trục abscissa và tần số được mô tả bằng các hình chữ nhật được xây dựng trên các khoảng tương ứng. Chiều cao của các cột trong trường hợp các khoảng bằng nhau phải tỷ lệ thuận với tần số.

Bất kỳ biểu đồ nào cũng có thể được chuyển đổi thành đa giác phân bố; để làm được điều này, cần nối các đỉnh của hình chữ nhật của nó với các đoạn thẳng.

2. Phương pháp chỉ số phân tích ảnh hưởng của sản lượng bình quân và số lượng nhân viên bình quân đến sự thay đổi sản lượng

Phương pháp chỉ mụcđược sử dụng để phân tích động lực và so sánh các chỉ số chung, cũng như các yếu tố ảnh hưởng đến sự thay đổi mức độ của các chỉ số này. Sử dụng các chỉ số, có thể xác định được ảnh hưởng của sản lượng trung bình và số lượng nhân viên trung bình đến sự thay đổi về khối lượng sản xuất. Vấn đề này được giải quyết bằng cách xây dựng một hệ thống các chỉ số phân tích.

Chỉ số khối lượng sản xuất liên quan đến số lao động bình quân và chỉ số sản lượng bình quân cũng giống như khối lượng sản xuất (Q) liên quan đến sản lượng ( w) và số ( r) .

Chúng ta có thể kết luận rằng khối lượng sản xuất sẽ bằng tích của sản lượng trung bình và số lượng nhân viên trung bình:

Q = w r, trong đó Q là khối lượng sản xuất,

w - sản lượng trung bình,

r – số lượng nhân viên trung bình.

Như bạn có thể thấy, chúng ta đang nói về mối quan hệ của các hiện tượng trong tĩnh học: tích của hai yếu tố sẽ cho tổng khối lượng của hiện tượng thu được. Rõ ràng là kết nối này có chức năng; do đó, động lực học của kết nối này được nghiên cứu bằng cách sử dụng các chỉ số. Đối với ví dụ đã cho, đây là hệ thống sau:

Jw × Jr = Jwr.

Ví dụ, chỉ số khối lượng sản xuất Jwr, với tư cách là chỉ số của hiện tượng sản xuất, có thể được phân tách thành hai chỉ số yếu tố: chỉ số sản lượng trung bình (Jw) và chỉ số số lượng nhân viên trung bình (Jr):

chỉ số chỉ số chỉ số

khối lượng tiền lương trung bình

số sản lượng sản xuất

Ở đâu J w- chỉ số năng suất lao động tính theo công thức Laspeyres;

Jr.- chỉ số số lượng nhân viên, được tính bằng công thức Paasche.

Hệ thống chỉ số được sử dụng để xác định ảnh hưởng của các yếu tố riêng lẻ đến việc hình thành mức độ của chỉ số hiệu suất; chúng cho phép xác định giá trị của một ẩn số từ 2 giá trị chỉ số đã biết.

Dựa vào hệ thống chỉ tiêu trên, người ta cũng có thể nhận thấy mức tăng tuyệt đối về khối lượng sản xuất được phân tách thành ảnh hưởng của các yếu tố.

1. Khối lượng sản xuất tăng chung:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Tăng do tác động của chỉ báo sản lượng bình quân:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Tăng do tác động của chỉ số số lượng nhân viên bình quân:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Ví dụ. Dữ liệu sau đây được biết

Chúng ta có thể xác định khối lượng sản xuất đã thay đổi như thế nào về mặt tương đối và tuyệt đối cũng như các yếu tố riêng lẻ ảnh hưởng đến sự thay đổi này như thế nào.

Khối lượng sản xuất là:

trong thời kỳ cơ sở

w 0 * r 0 = 2000 * 90 = 180000,

và trong báo cáo

w 1 * r 1 = 2100 * 100 = 210000.

Do đó, khối lượng sản xuất tăng 30.000 hoặc 1,16%.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

hoặc (210000:180000)*100%=1,16%.

Sự thay đổi về khối lượng sản xuất này là do:

1) số lượng nhân viên trung bình tăng thêm 10 người hay 111,1%

r 1 / r 0 = 100/90 = 1,11 hoặc 111,1%.

Xét về mặt tuyệt đối, do yếu tố này mà khối lượng sản xuất tăng thêm 20.000:

w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20000.

2) sản lượng trung bình tăng 105% hoặc 10.000:

w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1,05 hoặc 105%.

Về mặt tuyệt đối, mức tăng là:

w 1 r 1 – w 0 r 1 = (w 1 -w 0)r 1 = (2100-2000)*100 = 10000.

Do đó, ảnh hưởng tổng hợp của các yếu tố là:

1. Về mặt tuyệt đối

10000 + 20000 = 30000

2. Về mặt tương đối

1,11 * 1,05 = 1,16 (116%)

Như vậy mức tăng là 1,16%. Cả hai kết quả đều đạt được trước đó.

Từ “index” trong bản dịch có nghĩa là con trỏ, chỉ báo. Trong thống kê, chỉ số được hiểu là chỉ số tương đối mô tả sự thay đổi của một hiện tượng theo thời gian, không gian hoặc so với kế hoạch. Vì chỉ số là một giá trị tương đối nên tên của các chỉ số là phụ âm với tên của các giá trị tương đối.

Trong trường hợp chúng tôi phân tích những thay đổi theo thời gian của các sản phẩm được so sánh, chúng tôi có thể đặt ra câu hỏi về các thành phần của chỉ số (giá, khối lượng vật lý, cơ cấu sản xuất hoặc doanh số của từng loại sản phẩm) thay đổi như thế nào trong các điều kiện khác nhau (ở các khu vực khác nhau) . Về vấn đề này, các chỉ số về thành phần không đổi, thành phần thay đổi và thay đổi cấu trúc được xây dựng.

Chỉ số thành phần vĩnh viễn (cố định) –Đây là một chỉ số đặc trưng cho động thái của giá trị trung bình đối với cùng một cấu trúc dân số cố định.

Nguyên tắc xây dựng chỉ số thành phần không đổi là loại bỏ tác động của sự thay đổi trong cấu trúc trọng số đến giá trị được chỉ mục bằng cách tính mức trung bình có trọng số của chỉ báo chỉ mục có cùng trọng số.

Chỉ số thành phần không đổi có hình thức giống hệt với chỉ số tổng hợp. Hình thức tổng hợp là phổ biến nhất.

Chỉ số thành phần không đổi được tính toán với trọng số cố định ở mức một thời kỳ và chỉ hiển thị sự thay đổi ở giá trị được lập chỉ mục. Chỉ số thành phần không đổi loại bỏ ảnh hưởng của những thay đổi trong cấu trúc trọng số đến giá trị được chỉ mục bằng cách tính mức trung bình có trọng số của chỉ báo được lập chỉ mục với cùng trọng số. Các chỉ số có thành phần không đổi so sánh các chỉ số được tính toán trên cơ sở cấu trúc không thay đổi của hiện tượng.

Giai đoạn quan trọng nhất trong việc nghiên cứu các hiện tượng và quá trình kinh tế - xã hội là hệ thống hóa dữ liệu sơ cấp và trên cơ sở đó thu được đặc điểm tóm tắt của toàn bộ đối tượng bằng cách sử dụng các chỉ số chung, điều này đạt được bằng cách tóm tắt và nhóm các tài liệu thống kê sơ cấp.

Tóm tắt thống kê - đây là một phức hợp các hoạt động tuần tự nhằm khái quát hóa các sự kiện riêng lẻ cụ thể tạo thành một tập hợp nhằm xác định các đặc điểm và mô hình điển hình vốn có của hiện tượng đang được nghiên cứu một cách tổng thể. Tiến hành tổng hợp thống kê bao gồm các bước sau :

  • lựa chọn các đặc điểm nhóm;
  • xác định thứ tự thành lập nhóm;
  • xây dựng hệ thống chỉ tiêu thống kê để mô tả đặc điểm của các nhóm và đối tượng nói chung;
  • xây dựng bố cục bảng thống kê để trình bày kết quả tóm tắt.

Nhóm thống kê được gọi là sự phân chia các đơn vị dân số đang được nghiên cứu thành các nhóm đồng nhất theo những đặc điểm nhất định cần thiết cho họ. Phân nhóm là phương pháp thống kê quan trọng nhất để tổng hợp số liệu thống kê, là cơ sở để tính toán chính xác các chỉ tiêu thống kê.

Các loại nhóm sau đây được phân biệt: kiểu chữ, cấu trúc, phân tích. Tất cả các nhóm này được thống nhất bởi thực tế là các đơn vị của đối tượng được chia thành các nhóm theo một số đặc điểm.

Tính năng nhóm là một đặc điểm mà theo đó các đơn vị dân số được chia thành các nhóm riêng biệt. Kết luận của một nghiên cứu thống kê phụ thuộc vào việc lựa chọn đúng đặc điểm nhóm. Để làm cơ sở cho việc phân nhóm, cần sử dụng các đặc điểm có ý nghĩa, dựa trên lý thuyết (định lượng hoặc định tính).

Đặc điểm định lượng của việc phân nhóm có biểu thức bằng số (khối lượng giao dịch, tuổi của người đó, thu nhập gia đình, v.v.) và dấu hiệu định tính của việc phân nhóm phản ánh tình trạng của một đơn vị dân cư (giới tính, tình trạng hôn nhân, ngành nghề của doanh nghiệp, hình thức sở hữu, v.v.).

Sau khi cơ sở của việc phân nhóm đã được xác định, câu hỏi về số lượng nhóm mà dân số được nghiên cứu nên được chia vào phải được quyết định. Số lượng nhóm phụ thuộc vào mục tiêu của nghiên cứu và loại chỉ số làm nền tảng cho việc phân nhóm, số lượng dân số và mức độ biến đổi của đặc điểm.

Ví dụ, việc phân nhóm các doanh nghiệp theo loại hình sở hữu có tính đến tài sản chủ thể của thành phố, liên bang và liên bang. Nếu việc phân nhóm được thực hiện theo tiêu chí định lượng thì cần đặc biệt chú ý đến số lượng đơn vị của đối tượng nghiên cứu và mức độ biến động của đặc tính phân nhóm.

Khi số lượng nhóm đã được xác định, khoảng cách giữa các nhóm phải được xác định. Khoảng thời gian - đây là các giá trị của một đặc tính khác nhau nằm trong các ranh giới nhất định. Mỗi khoảng có giá trị riêng, ranh giới trên và dưới hoặc ít nhất một trong số chúng.

Giới hạn dưới của khoảng được gọi là giá trị nhỏ nhất của đặc tính trong khoảng và giới hạn trên - giá trị cao nhất của đặc tính trong khoảng. Giá trị của khoảng là sự khác biệt giữa ranh giới trên và ranh giới dưới.

Các khoảng nhóm, tùy thuộc vào kích thước của chúng, là: bằng nhau và không bằng nhau. Nếu sự biến đổi của một đặc điểm thể hiện trong phạm vi ranh giới tương đối hẹp và sự phân bố đồng đều thì một nhóm được xây dựng ở những khoảng cách bằng nhau. Giá trị của khoảng bằng nhau được xác định theo công thức sau :

trong đó Xmax, Xmin là giá trị tối đa và tối thiểu của đặc tính trong tổng hợp; n - số lượng nhóm.

Nhóm đơn giản nhất trong đó mỗi nhóm được chọn được đặc trưng bởi một chỉ báo đại diện cho một chuỗi phân phối.

Chuỗi phân phối thống kê - đây là sự phân bố có trật tự các đơn vị dân cư thành các nhóm theo một đặc điểm nhất định. Tùy thuộc vào đặc điểm cơ bản của sự hình thành chuỗi phân phối, chuỗi phân phối thuộc tính và biến thể được phân biệt.

Thuộc tính được gọi là chuỗi phân phối được xây dựng theo đặc điểm định tính, tức là những đặc điểm không biểu hiện bằng số (phân bố theo loại hình lao động, theo giới tính, theo nghề nghiệp, v.v.). Chuỗi phân phối thuộc tính đặc trưng cho thành phần dân số theo những đặc điểm cơ bản nhất định. Được thực hiện qua nhiều thời kỳ, những dữ liệu này giúp nghiên cứu những thay đổi về cấu trúc.

Chuỗi biến thể được gọi là chuỗi phân phối được xây dựng trên cơ sở định lượng. Bất kỳ chuỗi biến thể nào cũng bao gồm hai yếu tố: tùy chọn và tần số. Tùy chọn các giá trị riêng lẻ của đặc tính mà nó có trong chuỗi biến thể được gọi là giá trị cụ thể của đặc tính thay đổi.

Tần số số lượng các biến thể riêng lẻ hoặc từng nhóm của một chuỗi biến thể được gọi là, nghĩa là đây là những con số cho thấy tần suất các biến thể nhất định xuất hiện trong chuỗi phân phối. Tổng của tất cả các tần số xác định quy mô của toàn bộ dân số, khối lượng của nó. Tần số được gọi là tần số được biểu thị bằng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số. Theo đó, tổng tần số bằng 1 hoặc 100%.

Tùy thuộc vào bản chất biến đổi của một đặc điểm, ba dạng chuỗi biến thiên được phân biệt: chuỗi xếp hạng, chuỗi rời rạc và chuỗi khoảng.

Chuỗi biến thể được xếp hạng - đây là sự phân bố của các đơn vị dân số riêng lẻ theo thứ tự tăng dần hoặc giảm dần của đặc điểm đang được nghiên cứu. Xếp hạng cho phép bạn dễ dàng chia dữ liệu định lượng thành các nhóm, phát hiện ngay các giá trị nhỏ nhất và lớn nhất của một đặc tính và làm nổi bật các giá trị thường được lặp lại nhất.

Chuỗi biến thể rời rạc đặc trưng cho sự phân bố của các đơn vị dân số theo một đặc tính riêng biệt chỉ nhận các giá trị nguyên. Ví dụ: loại thuế, số con trong gia đình, số lượng nhân viên trong doanh nghiệp, v.v.

Nếu một đặc tính có sự thay đổi liên tục, trong giới hạn nhất định có thể nhận bất kỳ giá trị nào ("từ - đến"), thì đối với đặc tính này cần phải xây dựng chuỗi biến thiên khoảng . Ví dụ: mức thu nhập, thời gian làm việc, nguyên giá tài sản cố định của doanh nghiệp, v.v.

Ví dụ giải bài tập về chủ đề “Tóm tắt và phân nhóm thống kê”

Vấn đề 1 . Có thông tin về số lượng sách học sinh nhận được thông qua đăng ký trong năm học vừa qua.

Xây dựng chuỗi phân phối biến thể rời rạc và xếp hạng, chỉ định các phần tử của chuỗi.

Giải pháp

Bộ sách này thể hiện nhiều lựa chọn về số lượng sách học sinh nhận được. Hãy đếm số các phương án như vậy và sắp xếp chúng dưới dạng chuỗi phân bố rời rạc biến thiên được xếp hạng và biến thiên.

Vấn đề 2 . Có dữ liệu về chi phí tài sản cố định của 50 doanh nghiệp, nghìn rúp.

Xây dựng chuỗi phân phối, nêu bật 5 nhóm doanh nghiệp (theo các khoảng thời gian bằng nhau).

Giải pháp

Để giải quyết, chúng ta sẽ chọn giá trị lớn nhất và nhỏ nhất trong giá trị tài sản cố định của doanh nghiệp. Đây là 30,0 và 10,2 nghìn rúp.

Hãy tìm kích thước của khoảng: h = (30,0-10,2):5= 3,96 nghìn rúp.

Sau đó, nhóm đầu tiên sẽ bao gồm các doanh nghiệp có tài sản cố định từ 10,2 nghìn rúp. lên tới 10,2+3,96=14,16 nghìn rúp. Sẽ có 9 doanh nghiệp như vậy, nhóm thứ hai sẽ bao gồm các doanh nghiệp có tài sản cố định từ 14,16 nghìn rúp. lên tới 14,16+3,96=18,12 nghìn rúp. Sẽ có 16 doanh nghiệp như vậy, tương tự ta tìm số doanh nghiệp thuộc các nhóm thứ 3, thứ 4 và thứ 5.

Chúng tôi đặt chuỗi phân phối kết quả vào bảng.

Vấn đề 3 . Dữ liệu sau đây thu được từ một số doanh nghiệp công nghiệp nhẹ:

Nhóm các doanh nghiệp theo số lượng công nhân, tạo thành 6 nhóm cách đều nhau. Tính toán cho mỗi nhóm:

1. số lượng doanh nghiệp
2. số lượng công nhân
3. khối lượng sản phẩm sản xuất mỗi năm
4. Sản lượng thực tế bình quân trên một công nhân
5. khối lượng tài sản cố định
6. Quy mô tài sản cố định bình quân của một doanh nghiệp
7. Giá trị bình quân sản phẩm do một doanh nghiệp sản xuất ra

Trình bày kết quả tính toán dưới dạng bảng. Đi đến kết luận.

Giải pháp

Để giải, chúng ta sẽ chọn giá trị lớn nhất và nhỏ nhất của số lao động trung bình tại doanh nghiệp. Đây là 43 và 256.

Hãy tìm kích thước của khoảng: h = (256-43):6 = 35,5

Khi đó nhóm thứ nhất sẽ bao gồm các doanh nghiệp có số lao động bình quân từ 43 đến 43 + 35,5 = 78,5 người. Sẽ có 5 doanh nghiệp như vậy, Nhóm 2 gồm các doanh nghiệp có số lao động bình quân từ 78,5 đến 78,5+35,5=114 người. Sẽ có 12 doanh nghiệp như vậy, tương tự ta tìm số doanh nghiệp thuộc các nhóm thứ 3, thứ 4, thứ 5, thứ 6.

Chúng tôi đặt chuỗi phân phối kết quả vào một bảng và tính toán các chỉ số cần thiết cho từng nhóm:

Phần kết luận : Qua bảng có thể thấy, nhóm doanh nghiệp thứ hai có số lượng nhiều nhất. Nó bao gồm 12 doanh nghiệp. Nhóm nhỏ nhất là nhóm thứ năm và thứ sáu (mỗi nhóm hai doanh nghiệp). Đây là những doanh nghiệp lớn nhất (về số lượng lao động).

Vì nhóm thứ hai là lớn nhất nên khối lượng sản phẩm sản xuất mỗi năm của các doanh nghiệp thuộc nhóm này và khối lượng tài sản cố định cao hơn đáng kể so với các nhóm khác. Đồng thời, sản lượng thực tế bình quân trên một lao động tại các doanh nghiệp thuộc nhóm này không phải là lớn nhất. Các doanh nghiệp thuộc nhóm thứ tư đang dẫn đầu ở đây. Nhóm này cũng chiếm khối lượng tài sản cố định khá lớn.

Tóm lại, chúng tôi lưu ý rằng quy mô tài sản cố định trung bình và sản lượng trung bình do một doanh nghiệp sản xuất tỷ lệ thuận với quy mô của doanh nghiệp (về số lượng lao động).

Chuỗi phân phối thống kê– đây là sự phân bố có trật tự các đơn vị dân cư thành các nhóm theo một đặc điểm khác nhau nhất định.
Tùy thuộc vào đặc điểm cơ bản của sự hình thành chuỗi phân phối, có chuỗi phân phối thuộc tính và biến thể.

Sự hiện diện của một đặc điểm chung là cơ sở để hình thành một tổng thể thống kê, thể hiện kết quả của việc mô tả hoặc đo lường các đặc điểm chung của đối tượng nghiên cứu.

Chủ đề nghiên cứu về thống kê là các đặc điểm thay đổi (khác nhau) hoặc các đặc điểm thống kê.

Các loại đặc điểm thống kê.

Chuỗi phân phối được gọi là thuộc tínhđược xây dựng theo tiêu chí chất lượng. Thuộc tính– đây là ký hiệu có tên (ví dụ: nghề nghiệp: thợ may, giáo viên, v.v.).
Chuỗi phân phối thường được trình bày dưới dạng bảng. Trong bảng 2.8 hiển thị chuỗi phân phối thuộc tính.
Bảng 2.8 - Phân bổ các loại hình hỗ trợ pháp lý do luật sư cung cấp cho công dân của một trong các khu vực của Liên bang Nga.

Chuỗi biến thể– đây là các giá trị của đặc tính (hoặc khoảng giá trị) và tần số của chúng.
Chuỗi biến thiên là chuỗi phân phối, được xây dựng trên cơ sở định lượng. Bất kỳ chuỗi biến thể nào cũng bao gồm hai yếu tố: tùy chọn và tần số.
Các biến thể được coi là các giá trị riêng lẻ của một đặc tính mà nó có trong một chuỗi biến thể.
Tần số là số lượng các biến thể riêng lẻ hoặc từng nhóm của một chuỗi biến thể, tức là. Đây là những con số cho thấy tần suất xuất hiện các tùy chọn nhất định trong chuỗi phân phối. Tổng của tất cả các tần số xác định quy mô của toàn bộ dân số, khối lượng của nó.
Tần số là tần số được biểu thị dưới dạng phân số của một đơn vị hoặc dưới dạng phần trăm của tổng số. Theo đó, tổng tần số bằng 1 hoặc 100%. Chuỗi biến thiên cho phép người ta ước tính dạng của luật phân phối dựa trên dữ liệu thực tế.

Tùy theo tính chất biến đổi của tính trạng, có chuỗi biến thiên rời rạc và ngắt quãng.
Một ví dụ về chuỗi biến thiên rời rạc được đưa ra trong bảng. 2.9.
Bảng 2.9 - Phân bố các gia đình theo số phòng có người ở trong các căn hộ riêng lẻ năm 1989 ở Liên bang Nga.

Cột đầu tiên của bảng trình bày các tùy chọn cho chuỗi biến thể riêng biệt, cột thứ hai chứa tần số của chuỗi biến thể và cột thứ ba chứa các chỉ báo tần số.

Chuỗi biến thể

Một đặc điểm định lượng nhất định được nghiên cứu trong dân số nói chung. Một mẫu khối lượng được trích xuất ngẫu nhiên từ nó N, nghĩa là số phần tử mẫu bằng N. Ở giai đoạn đầu của quá trình xử lý thống kê, khác nhau mẫu, tức là thứ tự số x 1 , x 2 , …, xn Tăng dần. Mỗi giá trị quan sát x tôi gọi điện lựa chọn. Tính thường xuyên tôi tôi là số quan sát của giá trị x tôi trong mẫu. Tần số tương đối (tần số) Wi là tỉ số tần số tôi tôiđến cỡ mẫu N: .
Khi nghiên cứu chuỗi biến thiên, khái niệm tần số tích lũy và tần số tích lũy cũng được sử dụng. Cho phép x một số nào đó. Khi đó số lựa chọn , có giá trị nhỏ hơn x, được gọi là tần số tích lũy: với x i Nđược gọi là tần số tích lũy w i max.
Một đặc tính được gọi là biến rời rạc nếu các giá trị riêng lẻ (các biến thể) của nó khác nhau bởi một giá trị hữu hạn nhất định (thường là số nguyên). Chuỗi biến thiên của một đặc tính như vậy được gọi là chuỗi biến thiên rời rạc.

Bảng 1. Tổng quan về chuỗi tần số biến đổi rời rạc

Giá trị đặc trưngx tôi x 1 x 2 x n
Tần sốtôi tôi tôi 1 m 2 tôi n

Một đặc tính được gọi là thay đổi liên tục nếu các giá trị của nó khác nhau một lượng nhỏ tùy ý, tức là. một dấu hiệu có thể nhận bất kỳ giá trị nào trong một khoảng nhất định. Chuỗi biến thiên liên tục của một đặc tính như vậy được gọi là khoảng.

Bảng 2. Tổng quan về chuỗi biến đổi theo khoảng thời gian của tần số

Bảng 3. Hình ảnh đồ họa của loạt biến thể

Hàng ngangĐa giác hoặc biểu đồHàm phân phối theo kinh nghiệm
rời rạc
Khoảng thời gian
Bằng cách xem xét kết quả quan sát, người ta xác định được có bao nhiêu giá trị biến thể rơi vào từng khoảng cụ thể. Người ta giả định rằng mỗi khoảng thuộc về một trong các đầu của nó: trong mọi trường hợp bên trái (thường xuyên hơn) hoặc trong mọi trường hợp bên phải, và tần số hoặc tần số hiển thị số lượng tùy chọn có trong các ranh giới được chỉ định. Sự khác biệt một tôi – một tôi +1được gọi là các khoảng từng phần. Để đơn giản hóa các phép tính tiếp theo, chuỗi biến thiên khoảng có thể được thay thế bằng chuỗi biến thiên có điều kiện. Trong trường hợp này, giá trị trung bình Tôi-khoảng thời gian được coi là một tùy chọn x tôi và tần số khoảng tương ứng tôi tôi- về tần số của khoảng thời gian này.
Để biểu diễn đồ họa của chuỗi biến thiên, các phương pháp được sử dụng phổ biến nhất là đa giác, biểu đồ, đường cong tích lũy và hàm phân phối thực nghiệm.

Trong bảng 2.3 (Phân nhóm dân số Nga theo thu nhập bình quân đầu người vào tháng 4 năm 1994) được trình bày chuỗi biến thiên khoảng.
Thật thuận tiện khi phân tích chuỗi phân phối bằng cách sử dụng hình ảnh đồ họa, cho phép đánh giá hình dạng của phân phối. Một biểu diễn trực quan về bản chất của những thay đổi về tần số của chuỗi biến thể được đưa ra bởi đa giác và biểu đồ.
Đa giác được sử dụng khi mô tả chuỗi biến thể rời rạc.
Ví dụ, chúng ta hãy mô tả bằng đồ họa sự phân bổ quỹ nhà ở theo loại căn hộ (Bảng 2.10).
Bảng 2.10 - Phân bổ quỹ nhà ở đô thị theo loại căn hộ (số liệu có điều kiện).


Cơm. Khu vực phân bố nhà ở


Không chỉ các giá trị tần số mà cả tần số của chuỗi biến thiên cũng có thể được biểu thị trên trục tọa độ.
Biểu đồ được sử dụng để mô tả một chuỗi biến thiên theo khoảng thời gian. Khi xây dựng biểu đồ, các giá trị của các khoảng được vẽ trên trục abscissa và tần số được mô tả bằng các hình chữ nhật được xây dựng trên các khoảng tương ứng. Chiều cao của các cột trong trường hợp các khoảng bằng nhau phải tỷ lệ thuận với tần số. Biểu đồ là một biểu đồ trong đó một chuỗi được mô tả dưới dạng các thanh liền kề nhau.
Hãy để chúng tôi mô tả bằng đồ họa chuỗi phân phối khoảng thời gian được đưa ra trong bảng. 2.11.
Bảng 2.11 - Phân bổ hộ gia đình theo diện tích không gian sống bình quân đầu người (số liệu có điều kiện).
N p/p Nhóm gia đình theo quy mô không gian sống mỗi người Số gia đình có diện tích không gian sống nhất định Số lượng gia đình tích lũy
1 3 – 5 10 10
2 5 – 7 20 30
3 7 – 9 40 70
4 9 – 11 30 100
5 11 – 13 15 115
TỔNG CỘNG 115 ----


Cơm. 2.2. Biểu đồ phân bố gia đình theo quy mô không gian sống trên mỗi người


Sử dụng số liệu chuỗi tích lũy (Bảng 2.11), chúng tôi xây dựng phân phối tích lũy.


Cơm. 2.3. Phân bố lũy kế của các gia đình theo diện tích không gian sống trên mỗi người


Việc biểu diễn chuỗi biến thiên dưới dạng tích lũy đặc biệt hiệu quả đối với chuỗi biến thể có tần số được biểu thị dưới dạng phân số hoặc tỷ lệ phần trăm của tổng tần số chuỗi.
Nếu chúng ta thay đổi các trục khi mô tả bằng đồ họa một chuỗi biến thể dưới dạng tích lũy, thì chúng ta sẽ nhận được ogiva. Trong bộ lễ phục. 2.4 cho thấy một ogive được xây dựng trên cơ sở dữ liệu trong Bảng. 2.11.
Biểu đồ có thể được chuyển đổi thành đa giác phân bố bằng cách tìm trung điểm của các cạnh của hình chữ nhật và sau đó nối các điểm này bằng các đường thẳng. Đa giác phân phối kết quả được hiển thị trong Hình. 2.2 với một đường chấm chấm.
Khi xây dựng biểu đồ phân bố của một chuỗi biến thể với các khoảng không bằng nhau, không phải tần số được vẽ dọc theo trục tọa độ mà là mật độ phân bố của đặc tính trong các khoảng tương ứng.
Mật độ phân bố là tần số được tính trên mỗi đơn vị độ rộng khoảng cách, tức là có bao nhiêu đơn vị trong mỗi nhóm trên một đơn vị giá trị khoảng. Một ví dụ về tính toán mật độ phân phối được trình bày trong bảng. 2.12.
Bảng 2.12 - Phân bố doanh nghiệp theo số lượng lao động (số liệu có điều kiện)
N p/p Nhóm doanh nghiệp theo số lượng lao động, người. Số lượng doanh nghiệp Kích thước khoảng thời gian, mọi người. Mật độ phân bố
MỘT 1 2 3=1/2
1 Lên đến 20 15 20 0,75
2 20 – 80 27 60 0,25
3 80 – 150 35 70 0,5
4 150 – 300 60 150 0,4
5 300 – 500 10 200 0,05
TỔNG CỘNG 147 ---- ----

Cũng có thể được sử dụng để thể hiện bằng đồ họa chuỗi biến thể đường cong tích lũy. Sử dụng tích lũy (đường tổng), một loạt tần số tích lũy được mô tả. Tần số tích lũy được xác định bằng cách tính tổng tuần tự các tần số giữa các nhóm và cho biết có bao nhiêu đơn vị trong quần thể có các giá trị thuộc tính không lớn hơn giá trị đang được xem xét.


Cơm. 2.4. Cơ sở phân bổ hộ gia đình theo quy mô không gian sống bình quân đầu người

Khi xây dựng tích lũy của một chuỗi biến thiên theo khoảng, các biến thể của chuỗi được vẽ dọc theo trục hoành và tần số tích lũy được vẽ dọc theo trục tọa độ.