Xây dựng chuỗi biến thiên khoảng thời gian cho dữ liệu định lượng liên tục. Xây dựng một chuỗi biến phân rời rạc

nhóm lại- Đây là sự phân chia dân cư thành các nhóm đồng nhất về một mặt nào đó.

Phân công dịch vụ. Với máy tính trực tuyến, bạn có thể:

  • xây dựng một chuỗi biến thể, xây dựng một biểu đồ và một đa giác;
  • tìm các chỉ số về sự biến đổi (giá trị trung bình, phương thức (bao gồm bằng đồ thị), trung vị, phạm vi biến động, phần tư, phần thập phân, hệ số phân biệt của phần tư, hệ số biến động và các chỉ số khác);

Hướng dẫn. Để nhóm chuỗi, bạn phải chọn loại chuỗi biến thể kết quả (rời rạc hoặc khoảng) và chỉ định số lượng dữ liệu (số hàng). Giải pháp kết quả được lưu trong tệp Word (xem ví dụ về nhóm dữ liệu thống kê).

Số lượng dữ liệu đầu vào
",0);">

Nếu việc nhóm đã được thực hiện và chuỗi biến thể rời rạc hoặc chuỗi khoảng thời gian, thì bạn cần phải sử dụng các chỉ báo Biến thể của máy tính trực tuyến. Kiểm tra giả thuyết về kiểu phân phối sản xuất bằng cách sử dụng dịch vụ Nghiên cứu các hình thức phân phối.

Các loại nhóm thống kê

Chuỗi biến thể. Trong trường hợp quan sát một biến ngẫu nhiên rời rạc, có thể gặp cùng một giá trị nhiều lần. Các giá trị \ u200b \ u200bof x i như vậy của một biến ngẫu nhiên được ghi lại cho biết số lần nó xuất hiện trong n lần quan sát, đây là tần suất của giá trị này.
Trong trường hợp biến ngẫu nhiên liên tục, việc phân nhóm được sử dụng trong thực tế.
  1. Phân nhóm kiểu học- Đây là sự phân chia dân số không đồng nhất về chất lượng được nghiên cứu thành các giai cấp, các loại hình kinh tế - xã hội, các nhóm đơn vị đồng nhất. Để tạo nhóm này, hãy sử dụng tham số Chuỗi biến thể rời rạc.
  2. Nhóm cấu trúc được gọi là, trong đó một quần thể thuần nhất được chia thành các nhóm đặc trưng cho cấu trúc của nó theo một số đặc điểm khác nhau. Để tạo nhóm này, hãy sử dụng tham số Chuỗi khoảng thời gian.
  3. Một nhóm bộc lộ mối quan hệ giữa các hiện tượng được nghiên cứu và các đặc điểm của chúng được gọi là nhóm phân tích(xem nhóm phân tích của chuỗi).

Nguyên tắc xây dựng nhóm thống kê

Một loạt các quan sát được sắp xếp theo thứ tự tăng dần được gọi là một chuỗi biến thể. dấu hiệu nhóm là dấu hiệu phân chia dân số thành các nhóm riêng biệt. Nó được gọi là cơ sở của nhóm. Việc phân nhóm có thể dựa trên cả đặc điểm định lượng và định tính.
Sau khi xác định cơ sở của việc phân nhóm, câu hỏi về số lượng các nhóm mà dân số nghiên cứu nên được phân chia sẽ được quyết định.

Khi sử dụng máy tính cá nhân để xử lý dữ liệu thống kê, việc phân nhóm các đơn vị của một đối tượng được thực hiện bằng các quy trình chuẩn.
Một quy trình như vậy dựa trên việc sử dụng công thức Sturgess để xác định số lượng nhóm tối ưu:

k = 1 + 3,322 * lg (N)

Trong đó k là số nhóm, N là số đơn vị dân số.

Độ dài của từng phần được tính là h = (x max -x min) / k

Sau đó, đếm số lần truy cập quan sát trong các khoảng thời gian này, được coi là tần số n i. Ít tần số, giá trị của chúng nhỏ hơn 5 (n i< 5), следует объединить. в этом случае надо объединить и соответствующие интервалы.
Các trung điểm của khoảng x i = (c i-1 + c i) / 2 được lấy làm giá trị mới.

Phòng thí nghiệm số 1

Theo thống kê toán học

Chủ đề: Xử lý sơ cấp dữ liệu thực nghiệm

3. Đánh giá bằng điểm. một

5. Câu hỏi bảo mật .. 2

6. Phương pháp luận để thực hiện công việc trong phòng thí nghiệm .. 3

Khách quan

Có được kỹ năng xử lý sơ cấp dữ liệu thực nghiệm bằng phương pháp thống kê toán học.

Trên cơ sở tập dữ liệu thử nghiệm, hãy thực hiện các tác vụ sau:

Bài tập 1. Xây dựng một chuỗi phân phối biến thiên theo khoảng.

Nhiệm vụ 2. Xây dựng biểu đồ tần số của chuỗi biến thiên khoảng thời gian.

Nhiệm vụ 3. Soạn một hàm và biểu đồ phân phối theo kinh nghiệm.

a) chế độ và trung vị;

b) thời điểm ban đầu có điều kiện;

c) giá trị trung bình của mẫu;

d) phương sai mẫu, phương sai tổng thể đã hiệu chỉnh, độ lệch chuẩn đã hiệu chỉnh;

e) hệ số biến thiên;

e) tính không đối xứng;

g) kurtosis;

Nhiệm vụ 5. Xác định ranh giới của các giá trị thực của các đặc trưng số của biến ngẫu nhiên đang nghiên cứu với độ tin cậy cho trước.

Nhiệm vụ 6. Giải thích có ý nghĩa các kết quả của quá trình xử lý sơ cấp theo điều kiện của bài toán.

Ghi bằng điểm

Nhiệm vụ 1-56 điểm

Nhiệm vụ 62 điểm

Bảo vệ phòng thí nghiệm(phỏng vấn miệng về câu hỏi kiểm soát và công việc trong phòng thí nghiệm) - 2 điểm

Tác phẩm được gửi bằng văn bản trên các tờ A4 và bao gồm:

1) Trang tiêu đề (Phụ lục 1)

2) Dữ liệu ban đầu.

3) Trình bày công việc theo mẫu quy định.

4) Kết quả tính toán (được thực hiện thủ công và / hoặc sử dụng MS Excel) theo thứ tự được chỉ định.

5) Kết luận - một diễn giải có ý nghĩa về kết quả của quá trình xử lý sơ cấp theo điều kiện của vấn đề.

6) Phỏng vấn miệng về công việc và các câu hỏi kiểm soát.



5. Câu hỏi bảo mật


Phương pháp luận để thực hiện công việc trong phòng thí nghiệm

Nhiệm vụ 1. Xây dựng một chuỗi phân phối biến thiên theo khoảng

Để trình bày dữ liệu thống kê dưới dạng một chuỗi biến thiên với các biến thể cách đều nhau, cần phải:

1. Trong bảng dữ liệu ban đầu, hãy tìm giá trị nhỏ nhất và lớn nhất.

2. Xác định phạm vi biến đổi :

3. Xác định độ dài của khoảng thời gian h, nếu có đến 1000 dữ liệu trong mẫu thì sử dụng công thức: , trong đó n - cỡ mẫu - lượng dữ liệu trong mẫu; lgn được lấy để tính toán).

Tỷ lệ tính toán được làm tròn đến giá trị số nguyên thuận tiện .

4. Để xác định đầu của khoảng đầu tiên cho một số khoảng chẵn, nên lấy giá trị; và đối với một số khoảng thời gian lẻ.

5. Ghi lại các khoảng thời gian nhóm và sắp xếp chúng theo thứ tự tăng dần của ranh giới

, ,………., ,

đâu là giới hạn dưới của khoảng đầu tiên. Một số thuận tiện được lấy không quá, giới hạn trên của khoảng cuối cùng phải không nhỏ hơn. Khuyến nghị rằng các khoảng chứa các giá trị ban đầu của biến ngẫu nhiên và được tách biệt với 5 đến 20 các khoảng thời gian.

6. Ghi lại dữ liệu ban đầu về khoảng thời gian của các nhóm, tức là tính toán từ bảng ban đầu số lượng giá trị của một biến ngẫu nhiên nằm trong khoảng thời gian xác định. Nếu một số giá trị trùng với ranh giới của các khoảng, thì chúng chỉ được quy cho khoảng thời gian trước đó hoặc chỉ cho khoảng thời gian tiếp theo.

Nhận xét 1. Các khoảng thời gian không cần phải có độ dài bằng nhau. Ở những khu vực mà các giá trị dày đặc hơn, sẽ thuận tiện hơn để thực hiện các khoảng thời gian ngắn nhỏ hơn và ở những nơi ít thường xuyên hơn - các khoảng thời gian lớn hơn.

Ghi chú 2 Nếu đối với một số giá trị “không” hoặc giá trị nhỏ của tần số thu được, thì cần phải tập hợp lại dữ liệu, mở rộng các khoảng (tăng bước).

Công việc trong phòng thí nghiệm №1. Xử lý sơ cấp dữ liệu thống kê

Xây dựng chuỗi phân phối

Sự phân bố có thứ tự các đơn vị dân số thành các nhóm theo bất kỳ một thuộc tính nào được gọi là gần phân phối . Trong trường hợp này, dấu hiệu có thể là cả hai định lượng, khi đó chuỗi được gọi là biến dị và định tính, thì chuỗi được gọi là thuộc về . Vì vậy, ví dụ, dân số của một thành phố có thể được phân bố theo các nhóm tuổi trong một chuỗi biến thể hoặc theo liên kết nghề nghiệp trong một chuỗi thuộc tính (tất nhiên, nhiều đặc điểm định tính và định lượng hơn có thể được đề xuất để xây dựng chuỗi phân bố, sự lựa chọn của tính năng được xác định bởi nhiệm vụ của nghiên cứu thống kê).

Bất kỳ chuỗi phân phối nào được đặc trưng bởi hai yếu tố:

- quyền mua(x tôi) - đây là các giá trị riêng lẻ của thuộc tính đơn vị của tổng thể mẫu. Đối với chuỗi biến thể, biến thể nhận các giá trị số, đối với chuỗi phân bổ - các giá trị định tính (ví dụ: x = "công chức");

- tần số(N tôi) là một số hiển thị số lần giá trị này hoặc giá trị tính năng đó xuất hiện. Nếu tần suất được biểu thị bằng một số tương đối (tức là tỷ lệ các phần tử dân số tương ứng với một giá trị nhất định của các lựa chọn trong tổng khối lượng của tổng thể) thì nó được gọi là tần số tương đối hoặc tần số.

Chuỗi biến thể có thể là:

- rời rạc khi đặc điểm đang nghiên cứu được đặc trưng bởi một số nhất định (thường là số nguyên).

- khoảng thời gian khi các ranh giới "từ" và "đến" được xác định cho một đối tượng địa lý biến đổi liên tục. Một chuỗi khoảng thời gian cũng được xây dựng nếu tập hợp các giá trị của một đối tượng địa lý có thể thay đổi khác nhau là lớn.

Một chuỗi khoảng có thể được xây dựng với cả những khoảng có độ dài bằng nhau (chuỗi khoảng bằng nhau) và với những khoảng không bằng nhau, nếu điều này được quyết định bởi các điều kiện của nghiên cứu thống kê. Ví dụ, một loạt các phân phối thu nhập của dân cư với các khoảng thời gian sau có thể được coi là:<5тыс р., 5-10 тыс р., 10-20 тыс.р., 20-50 тыс р., и т.д. Если цель исследования не определяет способ построения интервального ряда, то строится равноинтервальный ряд, число интервалов в котором определяется по формуле Стерджесса:



với k là số khoảng, n là cỡ mẫu. (Tất nhiên, công thức thường cho một số phân số và số nguyên gần nhất với số kết quả được chọn làm số khoảng.) Độ dài của khoảng trong trường hợp này được xác định bởi công thức

.

Về mặt đồ họa, chuỗi biến thể có thể được biểu diễn dưới dạng biểu đồ("cột" chiều cao tương ứng với tần số trong khoảng này được xây dựng trên mỗi khoảng của chuỗi khoảng thời gian), khu vực phân phối(đường đứt đoạn nối các điểm ( x tôi;n tôi) hoặc tích lũy(được xây dựng theo tần suất tích lũy, tức là đối với mỗi giá trị của thuộc tính, tần suất xuất hiện trong tập hợp các đối tượng có giá trị của thuộc tính nhỏ hơn giá trị đã cho được lấy).

Khi làm việc trong Excel, các hàm sau có thể được sử dụng để tạo chuỗi biến thể:

KIỂM TRA( mảng dữ liệu) - để xác định cỡ mẫu. Đối số là phạm vi ô chứa dữ liệu mẫu.

COUNTIF ( phạm vi; tiêu chuẩn) - có thể được sử dụng để xây dựng một thuộc tính hoặc chuỗi biến thể. Các đối số là phạm vi của mảng giá trị mẫu của thuộc tính và tiêu chí - giá trị số hoặc văn bản của thuộc tính hoặc số ô chứa nó. Kết quả là tần suất xuất hiện của giá trị đó trong mẫu.

TẦN SỐ( mảng dữ liệu; mảng khoảng thời gian) - để xây dựng một chuỗi biến phân. Các đối số là phạm vi của mảng dữ liệu mẫu và cột khoảng thời gian. Nếu bắt buộc phải xây dựng một chuỗi rời rạc, thì giá trị của các tùy chọn được chỉ ra ở đây, nếu là khoảng, thì ranh giới trên của các khoảng (chúng còn được gọi là "túi"). Vì kết quả là một cột tần số, nên việc giới thiệu hàm phải được hoàn thành bằng cách nhấn tổ hợp phím CTRL + SHIFT + ENTER. Lưu ý rằng khi thiết lập một mảng khoảng thời gian khi giới thiệu một hàm, giá trị cuối cùng trong nó có thể bị bỏ qua - tất cả các giá trị không nằm trong "túi" trước đó sẽ được đặt trong "túi" tương ứng. Điều này đôi khi giúp tránh lỗi giá trị mẫu lớn nhất không được tự động đặt vào "túi" cuối cùng.

Ngoài ra, đối với các nhóm phức tạp (theo một số tiêu chí), công cụ "bảng tổng hợp" được sử dụng. Chúng cũng có thể được sử dụng để xây dựng chuỗi thuộc tính và biến thể, nhưng điều này làm phức tạp thêm nhiệm vụ một cách không cần thiết. Ngoài ra, để xây dựng một chuỗi biến thể và một biểu đồ, có một quy trình “biểu đồ” từ bổ trợ “Gói Phân tích” (để sử dụng bổ trợ trong Excel, trước tiên bạn phải tải chúng xuống, chúng không được cài đặt theo mặc định)

Chúng tôi minh họa quá trình xử lý dữ liệu sơ cấp bằng các ví dụ sau.

Ví dụ 1.1. có dữ liệu về thành phần định lượng của 60 họ.

Xây dựng một chuỗi biến thể và một đa giác phân phối

Dung dịch.

Hãy mở bảng tính Excel. Hãy nhập một mảng dữ liệu trong phạm vi A1: L5. Nếu bạn đang nghiên cứu một tài liệu ở dạng điện tử (ở định dạng Word chẳng hạn), tất cả những gì bạn cần làm là chọn một bảng có dữ liệu và sao chép nó vào khay nhớ tạm, sau đó chọn ô A1 và dán dữ liệu - chúng sẽ tự động chiếm phạm vi thích hợp. Hãy tính kích thước mẫu n - số lượng dữ liệu mẫu, đối với điều này, trong ô B7, nhập công thức = COUNT (A1: L5). Lưu ý rằng để nhập phạm vi mong muốn vào công thức, bạn không cần nhập chỉ định của nó từ bàn phím, chỉ cần chọn nó là đủ. Hãy xác định các giá trị nhỏ nhất và lớn nhất trong mẫu bằng cách nhập công thức = MIN (A1: L5) vào ô B8 và vào ô B9: = MAX (A1: L5).

Hình.1.1 Ví dụ 1. Xử lý sơ cấp dữ liệu thống kê trong bảng Excel

Tiếp theo, hãy chuẩn bị một bảng để xây dựng một chuỗi biến thể bằng cách nhập tên cho cột khoảng thời gian (giá trị tùy chọn) và cột tần suất. Trong cột khoảng thời gian, hãy nhập các giá trị của thuộc tính từ giá trị nhỏ nhất (1) đến tối đa (6), chiếm phạm vi B12: B17. Chọn cột tần suất, nhập công thức = FREQUENCY (A1: L5; B12: B17) và nhấn tổ hợp phím CTRL + SHIFT + ENTER

Hình.1.2 Ví dụ 1. Xây dựng một chuỗi biến thể

Để kiểm soát, chúng tôi tính toán tổng tần số bằng cách sử dụng hàm SUM (biểu tượng hàm S trong nhóm Chỉnh sửa trên tab Trang đầu), tổng được tính toán phải phù hợp với kích thước mẫu đã tính trước đó trong ô B7.

Bây giờ chúng ta hãy xây dựng một đa giác: sau khi chọn dải tần số kết quả, hãy chọn lệnh "Đồ thị" trên tab "Chèn". Theo mặc định, các giá trị trên trục hoành sẽ là số thứ tự - trong trường hợp của chúng tôi là từ 1 đến 6, trùng với giá trị của các tùy chọn (số loại thuế quan).

Tên loạt của biểu đồ "loạt 1" có thể được thay đổi bằng cách sử dụng cùng một tùy chọn "chọn dữ liệu" trên tab "Nhà thiết kế" hoặc chỉ cần xóa.

Hình 1.3. Ví dụ 1. Xây dựng đa giác tần số

Ví dụ 1.2. Dữ liệu có sẵn về phát thải chất ô nhiễm từ 50 nguồn:

10,4 18,6 10,3 26,0 45,0 18,2 17,3 19,2 25,8 18,7
28,2 25,2 18,4 17,5 41,8 14,6 10,0 37,8 10,5 16,0
18,1 16,8 38,5 37,7 17,9 29,0 10,1 28,0 12,0 14,0
14,2 20,8 13,5 42,4 15,5 17,9 19, 10,8 12,1 12,4
12,9 12,6 16,8 19,7 18,3 36,8 15,0 37,0 13,0 19,5

Biên dịch chuỗi khoảng thời gian bằng nhau, xây dựng biểu đồ

Dung dịch

Hãy thêm một mảng dữ liệu vào một trang tính Excel, nó sẽ chiếm phạm vi A1: J5 Như trong nhiệm vụ trước, chúng ta sẽ xác định kích thước mẫu n, các giá trị nhỏ nhất và lớn nhất trong mẫu. Vì bây giờ chúng ta không cần một chuỗi rời rạc mà là một chuỗi khoảng, và số khoảng trong bài toán không được chỉ định, chúng tôi tính số khoảng k bằng công thức Sturgess. Để thực hiện việc này, trong ô B10, nhập công thức = 1 + 3.322 * LOG10 (B7).

Hình 1.4. Ví dụ 2. Xây dựng một chuỗi khoảng bằng nhau

Giá trị kết quả không phải là số nguyên, nó xấp xỉ 6,64. Vì với k = 7 độ dài của các khoảng sẽ được biểu thị dưới dạng số nguyên (ngược lại với trường hợp k = 6), chúng ta sẽ chọn k = 7 bằng cách nhập giá trị này vào ô C10. Chúng tôi tính độ dài của khoảng d trong ô B11 bằng cách nhập công thức = (B9-B8) / C10.

Hãy xác định một mảng các khoảng, xác định giới hạn trên cho mỗi khoảng trong số 7 khoảng. Để thực hiện việc này, trong ô E8, hãy tính giới hạn trên của khoảng thời gian đầu tiên bằng cách nhập công thức = B8 + B11; trong ô E9 giới hạn trên của khoảng thời gian thứ hai bằng cách nhập công thức = E8 + B11. Để tính toán các giá trị còn lại của giới hạn trên của khoảng thời gian, chúng tôi cố định số ô B11 trong công thức đã nhập bằng cách sử dụng dấu $, để công thức trong ô E9 trở thành = E8 + B $ 11 và sao chép nội dung của ô E9 đến các ô E10-E14. Giá trị cuối cùng thu được bằng giá trị lớn nhất trong mẫu được tính trước đó trong ô B9.

Hình 1.5. Ví dụ 2. Xây dựng một chuỗi khoảng bằng nhau


Bây giờ, hãy điền vào mảng "túi" bằng cách sử dụng hàm FREQUENCY, như đã được thực hiện trong ví dụ 1.

Hình 6.1. Ví dụ 2. Xây dựng một chuỗi khoảng bằng nhau

Dựa trên chuỗi biến thể kết quả, chúng tôi sẽ xây dựng biểu đồ: chọn cột tần suất và chọn "Biểu đồ" trên tab "Chèn". Sau khi nhận được biểu đồ, chúng tôi sẽ thay đổi các nhãn của trục hoành trong đó thành các giá trị trong phạm vi khoảng thời gian, để làm điều này, chúng tôi chọn tùy chọn "Chọn dữ liệu" của tab "Nhà thiết kế". Trong cửa sổ xuất hiện, chọn lệnh "Thay đổi" cho phần "Nhãn trục ngang" và nhập phạm vi giá trị \ u200b \ u200 thay đổi bằng cách chọn nó bằng "chuột".

Hình 1.7. Ví dụ 2. Xây dựng biểu đồ

Hình 1.8. Ví dụ 2. Xây dựng biểu đồ

Một chuỗi biến thể rời rạc được xây dựng cho các tính năng rời rạc.

Để tạo một chuỗi biến thể rời rạc, bạn cần thực hiện những việc sau: 1) sắp xếp các đơn vị quan sát theo thứ tự tăng dần của giá trị thuộc tính đã nghiên cứu,

2) xác định tất cả các giá trị có thể có của thuộc tính x i, sắp xếp chúng theo thứ tự tăng dần,

giá trị dấu hiệu, tôi .

tần số giá trị tính năng và biểu thị f tôi . Tổng tất cả các tần số của chuỗi bằng số phần tử trong tổng thể nghiên cứu.

ví dụ 1 .

Danh sách các học sinh đạt điểm trong các kỳ thi: 3; bốn; 3; 5; bốn; 2; 2; bốn; bốn; 3; 5; 2; bốn; 5; bốn; 3; bốn; 3; 3; bốn; bốn; 2; 2; 5; 5; bốn; 5; 2; 3; bốn; bốn; 3; bốn; 5; 2; 5; 5; bốn; 3; 3; bốn; 2; bốn; bốn; 5; bốn; 3; 5; 3; 5; bốn; bốn; 5; bốn; bốn; 5; bốn; 5; 5; 5.

Đây là số X - lớplà một biến ngẫu nhiên rời rạc và danh sách kết quả của các ước tính làdữ liệu thống kê (quan sát) .

    sắp xếp các đơn vị quan sát theo thứ tự tăng dần của giá trị được nghiên cứu của đối tượng địa lý:

2; 2; 2; 2; 2; 2; 2; 2; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 4; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5; 5.

2) xác định tất cả các giá trị có thể có của thuộc tính x i, sắp xếp chúng theo thứ tự tăng dần:

Trong ví dụ này, tất cả các điểm số có thể được chia thành bốn nhóm với các giá trị sau: 2; 3; bốn; 5.

Giá trị của một biến ngẫu nhiên tương ứng với một nhóm dữ liệu quan sát riêng biệt được gọi là giá trị dấu hiệu, biến thể (tùy chọn) và chỉ định x tôi .

Số cho biết số lần giá trị đối tượng tương ứng xuất hiện trong một chuỗi quan sát được gọi là tần số giá trị tính năng và biểu thị f tôi .

Ví dụ của chúng tôi

điểm 2 xảy ra - 8 lần,

điểm 3 xảy ra - 12 lần,

điểm 4 xảy ra - 23 lần,

điểm 5 xảy ra - 17 lần.

Tổng cộng có 60 xếp hạng.

4) ghi dữ liệu nhận được vào một bảng gồm hai hàng (cột) - x i và f i.

Dựa trên những dữ liệu này, có thể xây dựng một chuỗi biến phân rời rạc

Chuỗi biến thể rời rạc - đây là bảng trong đó các giá trị xuất hiện của tính trạng được nghiên cứu được chỉ ra dưới dạng các giá trị riêng biệt theo thứ tự tăng dần và tần số của chúng

  1. Xây dựng một chuỗi biến thể theo khoảng thời gian

Ngoài một chuỗi biến phân rời rạc, thường có một cách nhóm dữ liệu như một chuỗi biến phân khoảng.

Một chuỗi khoảng thời gian được tạo nếu:

    dấu hiệu có tính chất thay đổi liên tục;

    có rất nhiều giá trị rời rạc (hơn 10)

    tần số của các giá trị rời rạc là rất nhỏ (không vượt quá 1-3 với số lượng đơn vị quan sát tương đối lớn);

    nhiều giá trị rời rạc của một đối tượng có cùng tần số.

Chuỗi biến thiên theo khoảng là cách nhóm dữ liệu dưới dạng bảng có hai cột (các giá trị đặc trưng dưới dạng một khoảng giá trị và tần suất của mỗi khoảng).

Không giống như một chuỗi rời rạc, các giá trị của dấu hiệu của một chuỗi khoảng không được biểu diễn bằng các giá trị riêng lẻ, mà bằng một khoảng giá trị ("từ - đến").

Con số cho biết có bao nhiêu đơn vị quan sát rơi vào mỗi khoảng thời gian đã chọn được gọi là tần số giá trị tính năng và biểu thị f tôi . Tổng tất cả các tần số của chuỗi bằng số phần tử (đơn vị quan sát) trong quần thể nghiên cứu.

Nếu một đơn vị có giá trị đặc trưng bằng giá trị của giới hạn trên của khoảng, thì đơn vị đó sẽ được quy về khoảng tiếp theo.

Ví dụ, một đứa trẻ có chiều cao 100 cm sẽ rơi vào khoảng thứ 2, và không vào khoảng thứ nhất; và đứa trẻ có chiều cao 130 cm sẽ rơi vào khoảng cuối cùng, và không rơi vào khoảng thứ ba.

Dựa trên những dữ liệu này, có thể xây dựng một chuỗi biến thiên theo khoảng thời gian.

Mỗi khoảng có giới hạn dưới (x n), giới hạn trên (x in) và chiều rộng khoảng ( tôi).

Ranh giới khoảng là một giá trị đối tượng nằm trên biên giới của hai khoảng.

chiều cao của trẻ em (cm)

chiều cao của trẻ em (cm)

số lượng trẻ em

trên 130

Nếu một khoảng có giới hạn trên và giới hạn dưới, thì nó được gọi là khoảng thời gian đóng cửa. Nếu khoảng chỉ có giới hạn dưới hoặc chỉ có giới hạn trên, thì đây là - khoảng thời gian mở. Chỉ khoảng đầu tiên hoặc khoảng cuối cùng mới có thể được mở. Trong ví dụ trên, khoảng cuối cùng được mở.

Chiều rộng khoảng (tôi) là sự khác biệt giữa giới hạn trên và giới hạn dưới.

tôi = x n - x trong

Chiều rộng của một khoảng mở được giả định là bằng với chiều rộng của một khoảng đóng liền kề.

chiều cao của trẻ em (cm)

số lượng trẻ em

Chiều rộng khoảng (i)

cho phép tính 130 + 20 = 150

20 (vì chiều rộng của khoảng đóng liền kề là 20)

Tất cả các chuỗi khoảng được chia thành chuỗi khoảng với các khoảng bằng nhau và chuỗi khoảng với các khoảng không bằng nhau. . Trong các hàng khoảng có các khoảng bằng nhau, chiều rộng của tất cả các khoảng là như nhau. Trong chuỗi khoảng có các khoảng không bằng nhau, độ rộng của các khoảng là khác nhau.

Trong ví dụ này, một chuỗi khoảng thời gian với các khoảng thời gian không bằng nhau.

Trong nhiều trường hợp, nếu tổng thể thống kê bao gồm một số lượng lớn hoặc thậm chí nhiều hơn, vô số phương án, thường được tìm thấy nhiều nhất với sự thay đổi liên tục, thì việc hình thành một nhóm đơn vị cho mỗi phương án là không thể và không thực tế. Trong những trường hợp như vậy, việc liên kết các đơn vị thống kê thành các nhóm chỉ có thể thực hiện được trên cơ sở khoảng thời gian, tức là như một nhóm có giới hạn nhất định về các giá trị của thuộc tính khác nhau. Các giới hạn này được biểu thị bằng hai con số chỉ giới hạn trên và giới hạn dưới của mỗi nhóm. Việc sử dụng các khoảng dẫn đến việc hình thành một chuỗi phân phối khoảng.

khoảng thời gian rad là một chuỗi biến thể, các biến thể của chúng được trình bày dưới dạng khoảng thời gian.

Một chuỗi khoảng có thể được hình thành với các khoảng bằng nhau và không bằng nhau, trong khi việc lựa chọn nguyên tắc để xây dựng chuỗi này phụ thuộc chủ yếu vào mức độ đại diện và thuận tiện của tổng thể thống kê. Nếu tập hợp đủ lớn (đại diện) về số lượng đơn vị và khá đồng nhất về thành phần của nó, thì nên đặt các khoảng bằng nhau làm cơ sở cho việc hình thành chuỗi khoảng. Thông thường, theo nguyên tắc này, một chuỗi khoảng thời gian được hình thành cho những quần thể mà phạm vi biến động tương đối nhỏ, tức là các biến thể tối đa và tối thiểu thường khác nhau vài lần. Trong trường hợp này, giá trị của các khoảng thời gian bằng nhau được tính bằng tỷ số giữa phạm vi biến đổi tính trạng với số khoảng hình thành đã cho. Để xác định bằng khoảng thời gian, công thức Sturgess có thể được sử dụng (thường với một sự thay đổi nhỏ trong các tính năng của khoảng thời gian và một số lượng lớn các đơn vị trong tổng thể thống kê):

x tôi ở đâu - giá trị của một khoảng bằng nhau; X max, X min - tùy chọn tối đa và tối thiểu trong tổng thể thống kê; N . - số lượng đơn vị trong quần thể.

Thí dụ. Nên tính kích thước của một khoảng bằng nhau về mật độ ô nhiễm phóng xạ với xêzi - 137 trong 100 khu định cư của quận Krasnopolsky thuộc vùng Mogilev, nếu biết rằng biến thể ban đầu (tối thiểu) bằng I km / km 2, trận chung kết ( tối đa) - 65 ki / km 2. Sử dụng công thức 5.1. chúng tôi nhận được:

Do đó, để tạo thành một chuỗi khoảng cách với các khoảng thời gian bằng nhau cho mật độ ô nhiễm xêzi - 137 khu định cư của quận Krasnopolsky, kích thước của một khoảng bằng nhau có thể là 8 ki / km 2.

Trong điều kiện phân phối không đồng đều, tức là khi các tùy chọn tối đa và tối thiểu là hàng trăm lần, khi hình thành chuỗi khoảng thời gian, bạn có thể áp dụng nguyên tắc không cân bằng các khoảng thời gian. Các khoảng thời gian không bằng nhau thường tăng lên khi bạn di chuyển đến các giá trị lớn hơn của đối tượng địa lý.

Hình dạng của các khoảng có thể được đóng và mở. Đã đóng cửa Thông thường đặt tên cho các khoảng thời gian mà cả ranh giới dưới và ranh giới trên đều được chỉ định. mở các khoảng chỉ có một ranh giới: trong khoảng đầu tiên - khoảng trên, trong khoảng cuối cùng - ranh giới dưới.

Nên đánh giá các chuỗi khoảng thời gian, đặc biệt là những chuỗi có khoảng thời gian không bằng nhau, có tính đến mật độ phân phối, cách đơn giản nhất để tính toán đó là tỷ lệ giữa tần số địa phương (hoặc tần suất) với kích thước của khoảng thời gian.

Đối với sự hình thành thực tế của chuỗi khoảng thời gian, bạn có thể sử dụng cách bố trí của bảng. 5.3.

T a b l e 5.3. Quy trình hình thành một loạt các khu định cư xen kẽ ở quận Krasnopolsky theo mật độ ô nhiễm phóng xạ với xêzi -137

Ưu điểm chính của chuỗi khoảng thời gian là giới hạn của nó sự nhỏ gọn.đồng thời, trong chuỗi khoảng thời gian của sự phân bố, các biến thể riêng lẻ của tính trạng được ẩn trong các khoảng tương ứng

Khi biểu diễn đồ họa của một chuỗi khoảng trong một hệ tọa độ hình chữ nhật, ranh giới trên của các khoảng được vẽ trên trục abscissa và các tần số cục bộ của chuỗi nằm trên trục tọa độ. Cấu trúc đồ họa của một chuỗi khoảng khác với cấu trúc của một đa giác phân phối ở chỗ mỗi khoảng có một giới hạn dưới và một giới hạn trên, và hai abscissas tương ứng với bất kỳ giá trị nào của tọa độ. Do đó, trên đồ thị của chuỗi khoảng, không phải một điểm được đánh dấu, như trong một đa giác, mà là một đoạn thẳng nối hai điểm. Các đường ngang này được nối với nhau bằng các đường thẳng đứng và ta có được hình đa giác bậc, thường được gọi là biểu đồ các phân phối (Hình 5.3).

Trong việc xây dựng đồ họa của một chuỗi khoảng thời gian cho một tổng thể thống kê đủ lớn, biểu đồ tiếp cận đối xứng hình thức phân phối. Trong những trường hợp dân số thống kê nhỏ, theo quy luật, nó được hình thành không đối xứng biểu đồ cột.

Trong một số trường hợp, có sự hợp lý trong việc hình thành một số tần số tích lũy, tức là tích lũy hàng ngang. Một chuỗi tích lũy có thể được hình thành trên cơ sở một chuỗi phân bố rời rạc hoặc theo khoảng thời gian. Khi một chuỗi tích lũy được hiển thị bằng đồ thị trong một hệ thống tọa độ hình chữ nhật, các tùy chọn được vẽ trên trục abscissa và tần số tích lũy (tần số) được vẽ trên trục tọa độ. Đường cong kết quả được gọi là tích lũy các phân phối (Hình 5.4).

Sự hình thành và biểu diễn đồ thị của các loại chuỗi biến phân khác nhau góp phần đơn giản hóa việc tính toán các đặc điểm thống kê chính, được thảo luận chi tiết trong chủ đề 6, giúp hiểu rõ hơn bản chất của các quy luật phân phối của một tổng thể thống kê. Việc phân tích chuỗi biến thể có tầm quan trọng đặc biệt trong những trường hợp cần xác định và truy tìm mối quan hệ giữa các biến thể và tần số (tần số). Sự phụ thuộc này được thể hiện trong thực tế là số lượng các trường hợp cho mỗi biến thể theo một cách nhất định có liên quan đến giá trị của biến thể này, tức là với sự gia tăng các giá trị của dấu hiệu thay đổi tần số (tần suất) của các giá trị này, chúng trải qua những thay đổi nhất định, có hệ thống. Điều này có nghĩa là các con số trong cột tần số (tần số) không bị dao động hỗn loạn mà thay đổi theo một hướng nhất định, theo một thứ tự và trình tự nhất định.

Nếu các tần số trong các thay đổi của chúng cho thấy một tính hệ thống nhất định, thì điều này có nghĩa là chúng ta đang trên đường xác định các mẫu. Hệ thống, trật tự, trình tự thay đổi tần số là sự phản ánh những nguyên nhân chung, những điều kiện chung mang tính đặc trưng của toàn bộ dân số.

Không nên cho rằng mẫu phân phối luôn được tạo sẵn. Có khá nhiều chuỗi biến thiên trong đó các tần số tăng hoặc giảm một cách kỳ lạ. Trong những trường hợp như vậy, nên tìm hiểu loại phân phối mà nhà nghiên cứu đang xử lý: hoặc phân phối này không có tính quy luật nào cả, hoặc bản chất của nó vẫn chưa được xác định: Trường hợp đầu tiên là hiếm, trong khi trường hợp thứ hai, trường hợp thứ hai là một hiện tượng khá thường xuyên và rất phổ biến.

Vì vậy, khi hình thành một chuỗi khoảng thời gian, tổng số đơn vị thống kê có thể nhỏ và một số lượng nhỏ các tùy chọn rơi vào mỗi khoảng (ví dụ: 1-3 đơn vị). Trong những trường hợp như vậy, không cần thiết phải dựa vào biểu hiện của bất kỳ sự đều đặn nào. Để thu được kết quả đều đặn dựa trên các quan sát ngẫu nhiên, quy luật số lớn phải có hiệu lực, tức là sao cho mỗi khoảng sẽ không có vài, mà là hàng chục và hàng trăm đơn vị thống kê. Muốn vậy, chúng ta phải cố gắng tăng số lượng quan sát nhiều nhất có thể. Đây là cách chắc chắn nhất để phát hiện các mẫu trong quy trình hàng loạt. Nếu không có cơ hội thực sự để tăng số lượng quan sát, thì việc xác định các mẫu có thể đạt được bằng cách giảm số khoảng thời gian trong chuỗi phân phối. Giảm số khoảng trong chuỗi biến thiên, do đó tăng số tần số trong mỗi khoảng. Điều này có nghĩa là các biến động ngẫu nhiên của từng đơn vị thống kê được xếp chồng lên nhau, được "làm mịn", biến thành một khuôn mẫu.

Việc hình thành và xây dựng chuỗi biến phân cho phép bạn chỉ có được một bức tranh tổng quát, gần đúng về sự phân bố của dân số thống kê. Ví dụ, một biểu đồ chỉ thể hiện một cách đại khái mối quan hệ giữa các giá trị của một đặc điểm và các tần số (tần số) của nó. Do đó, chuỗi biến thiên về cơ bản chỉ là cơ sở để nghiên cứu sâu hơn về tính đều đặn bên trong của phân bố tĩnh.

CHỦ ĐỀ 5 CÂU HỎI

1. Biến dị là gì? Nguyên nhân nào gây ra sự biến động của một tính trạng trong quần thể thống kê?

2. Những loại dấu hiệu biến đổi nào có thể diễn ra trong thống kê?

3. Chuỗi biến thiên là gì? Các loại chuỗi biến thiên là gì?

4. Chuỗi xếp hạng là gì? ưu điểm và nhược điểm của nó là gì?

5. Series rời rạc là gì và ưu nhược điểm của nó là gì?

6. Trình tự hình thành của dãy số khoảng là gì, ưu nhược điểm của nó là gì?

7. Biểu diễn đồ họa của một chuỗi phân bố khoảng, rời rạc, được xếp hạng là gì?

8. Tích lũy phân phối là gì và đặc điểm của nó là gì?