លក្ខណៈវិនិច្ឆ័យ T របស់សិស្ស ការគណនាដោយស្វ័យប្រវត្តិតាមអ៊ីនធឺណិត។ កំណត់សារៈសំខាន់នៃភាពខុសគ្នាដោយប្រើតេស្ត t របស់សិស្ស

ក្នុងករណីភាគច្រើនដើម្បីប្រៀបធៀបតម្លៃមធ្យមនៃពីរ គំរូឯករាជ្យ(ទំព័រ 91) អនុវត្តការធ្វើតេស្តរបស់សិស្ស។ ដោយសារការធ្វើតេស្តរបស់សិស្សមានលក្ខណៈប៉ារ៉ាម៉ែត្រ ការប្រើប្រាស់របស់វាអាចធ្វើទៅបានលុះត្រាតែលទ្ធផលនៃការសិក្សាត្រូវបានបង្ហាញក្នុងទម្រង់នៃការវាស់វែងដោយយោងតាម មាត្រដ្ឋានទំនាក់ទំនង(ទំ.៩០)។

ការធ្វើតេស្ត t របស់សិស្សត្រូវបានចង្អុលបង្ហាញ tហើយត្រូវបានគណនាដោយរូបមន្ត*៖

t = x1 − x2 / √ m1² + m2²

ក្នុងករណីដែលចំនួននៃការសង្កេត (n) លើសពី 500 កម្រិតសារៈសំខាន់នៅ p = 0.05 ត្រូវបានសម្រេចនៅ t = 1.96 កម្រិតសារៈសំខាន់នៅ p = 0.01 ឬ p = 0.001 រៀងគ្នាត្រូវបានសម្រេចនៅ t = 2.59 និង t = 3.29 ។

ប្រសិនបើចំនួននៃការសង្កេតតិចជាង 500 តម្លៃ t ដែលត្រូវការសម្រាប់កម្រិតសារៈសំខាន់ផ្សេងៗត្រូវបានកំណត់ពីតារាង 10 ។

មុនពេលងាកទៅតុអ្នកត្រូវកំណត់លេខ កម្រិតនៃសេរីភាព។ពាក្យនេះសំដៅទៅលើចំនួននៃបរិមាណឯករាជ្យដែលពាក់ព័ន្ធនឹងការបង្កើតប៉ារ៉ាម៉ែត្រជាក់លាក់មួយ (f) ។ ច្បាប់សម្រាប់កំណត់កម្រិតនៃសេរីភាពត្រូវបានបង្ហាញនៅក្នុងសៀវភៅណែនាំផ្សេងៗស្តីពីស្ថិតិគណិតវិទ្យា (Yu.K. Demyanenko, 1968)។ នៅពេលគណនាការប្រលងសិស្ស t ចំនួនសរុបនៃដឺក្រេនៃសេរីភាព (f) នឹងស្មើនឹង n1 + n2 - ២.

ដូច្នេះ ជាឧទាហរណ៍ នៅពេលប្រៀបធៀបលទ្ធផលដែលបង្ហាញដោយអ្នកជិះស្គីនៃក្រុមពិសោធន៍ និងក្រុមត្រួតពិនិត្យក្នុងការបញ្ចប់ចម្ងាយត្រួតពិនិត្យ ទិន្នន័យខាងក្រោមត្រូវបានទទួល៖ សូចនាករជាមធ្យមក្នុងក្រុមពិសោធន៍ (n = 12 នាក់) គឺ x = 34.6 វិនាទី កំហុសនៃតម្លៃមធ្យមគឺ m = 0.47 វិនាទី; នៅក្នុងក្រុមត្រួតពិនិត្យ (n = 14 នាក់) ទិន្នន័យទាំងនេះគឺរៀងគ្នា x = 37.3 វិនាទី m = 0.49 វិនាទី។

ការជំនួសតម្លៃទៅក្នុងរូបមន្តយើងទទួលបានតម្លៃនៃ t ។

t = 37.3 - 34.6 / √ V 0.49 2 + 0.47 2 = 2.7 / 0.68 = 3.97

បន្ទាប់ពីកំណត់ចំនួនដឺក្រេនៃសេរីភាព (f = 12 + 14 - 2 = 24) យើងរកឃើញតម្លៃនៃ t ពីតារាង។ តម្លៃលទ្ធផលនៃ 3.97 លើសពីតម្លៃតារាងសម្រាប់កម្រិតទំនុកចិត្ត 99% ។ នេះមានន័យថាយើងអាចអះអាងថាមានភាពខុសគ្នាយ៉ាងសំខាន់រវាងលទ្ធផលនៃក្រុមប្រៀបធៀបទាំងពីរនៅកម្រិតសារៈសំខាន់ p< 0,01.



ជាមួយនឹងចំនួនរង្វាស់ដ៏ច្រើន វាត្រូវបានទទួលយកជាធម្មតាថា ប្រសិនបើភាពខុសគ្នារវាងមធ្យមនព្វន្ធគឺស្មើនឹង ឬច្រើនជាងបីនៃកំហុសរបស់វា នោះភាពខុសគ្នាត្រូវបានចាត់ទុកថាអាចទុកចិត្តបាន។ ក្នុងករណីនេះ ភាពជឿជាក់នៃភាពខុសគ្នាត្រូវបានកំណត់ដោយសមីការខាងក្រោម៖

Х E -Х К > 3√ ខ្ញុំ + mк ²

ក្នុង​ឧទាហរណ៍​ខាង​លើ លទ្ធផល​នៃ​អ្នក​ពាក់ព័ន្ធ​ក្នុង​ក្រុម​ផ្សេង​គ្នា​ត្រូវ​បាន​គេ​ប្រៀប​ធៀប​នោះ​គឺ គំរូឯករាជ្យ។ក្នុងករណីដែលលទ្ធផលដែលទទួលបាននៅដើម និងចុងបញ្ចប់នៃការពិសោធន៍ក្នុងក្រុមដូចគ្នាត្រូវបានប្រៀបធៀប នោះគឺនៅពេលណា គំរូអាស្រ័យ,គណនាការធ្វើតេស្តរបស់សិស្សដោយប្រើរូបមន្តធម្មតា។ វាត្រូវបានហាមឃាត់ . លក្ខណៈវិនិច្ឆ័យរបស់សិស្សក្នុងករណីនេះគួរតែត្រូវបានគណនាដោយប្រើរូបមន្ត៖

t = X 1 -X 2 / m1 ² + m2 ² - 2rm1 m2

កន្លែងណា r - មេគុណទំនាក់ទំនងរវាងលទ្ធផលដំបូង និងចុងក្រោយសម្រាប់លក្ខណៈដែលកំពុងសិក្សា។

តារាង 10

កំណត់តម្លៃ t (ការធ្វើតេស្តរបស់សិស្ស)

f កម្រិតទំនុកចិត្ត (P)
95% . 99% 99,9%
12,71 63.60
4.30 9.93 31.60
3.18 5.84 12.94
2.78 4.60 8.61
2.57 4.03 6.86
2.45 3.71 5.96
2.37 3.50 5.41
2.31 3.36 5,04
2.26 3.25 4.78
2.23 3.17 4.59
ទំ 2.20 3.11 4.44
2.18 3.06 4.32
1.16 3.01 4.22
2.15 2,98 4,14
2.13 2.95 4.07
2.12 2,92 4.02
2.11 2.90 3.97
2.10 2.88 3.92
2.09 2.86 3.88
2.09 2.85 3.85
2.08 2,83 3.82
2.07 2.82 3.79
2.07 2.81 3,77
2.06 2.80 3.75
2,06 2.79 3.73
2.06 2.78 3.71
2.05 2.77 3.69
2.05 2.76 3.67
2.04 2.76 3.66
2.04 2,75 " 3.65
2.02 2,70 3.55
2.01 2.68 3,50
2.00 2.66 3.46
1.99 2.64 3.42
1.98 2.63 3.39
1.98 2,62 3.37
1.97 2.60 3.34
1.96 2,59 3.31
អូ 1.96 2.59 3.29
កម្រិតសារៈសំខាន់ (ទំ)
0,05 0,01 0,001

ការបង្កើតការសន្និដ្ឋាន

(សេចក្តីសន្និដ្ឋាន)

នៅចុងបញ្ចប់នៃការងារការសន្និដ្ឋានត្រូវបានទាញ។ ការបង្កើតសេចក្តីសន្និដ្ឋាន រួមជាមួយនឹងការបង្កើតសេចក្តីផ្តើម គឺជាដំណាក់កាលដ៏លំបាក និងសំខាន់បំផុតមួយក្នុងការរៀបចំការងារវគ្គសិក្សាណាមួយ។

ការសន្និដ្ឋានគួរតែឆ្លុះបញ្ចាំងពីលទ្ធផលដ៏សំខាន់បំផុតនៃការសិក្សា។

មានកំហុសទូទៅមួយចំនួននៅពេលគូរការសន្និដ្ឋាន។ ជារឿយៗ សិស្សបង្កើតសំណើមួយ ដូច្នេះវាស្តាប់ទៅដូចជាការប្រកាសអំពីលទ្ធផលនៃការងារដែលគាត់បានធ្វើ ("បានសិក្សា" "បានអភិវឌ្ឍ" ។ល។)។ ឧទាហរណ៍៖

"ក្នុងអំឡុងពេលនៃការសិក្សា បញ្ញត្តិសំខាន់ៗនៃវិធីសាស្រ្តពិសោធន៍ត្រូវបានកំណត់... ”។

ដើម្បីឱ្យការសន្និដ្ឋានខាងលើជាសេចក្តីសន្និដ្ឋាន ឃ្លាគួរត្រូវបានរៀបចំឡើងដូចនេះ៖ “បទប្បញ្ញត្តិនៃវិធីសាស្រ្តពិសោធន៍ដែលយើងបានបង្កើតអនុញ្ញាត ... ដើម្បីវាយតម្លៃកម្រិតនៃជំនាញទំនាក់ទំនងរបស់សិស្ស ឯកទេសគរុកោសល្យគឺ...”

កំហុសទូទៅមួយទៀតគឺសម្រាប់សិស្សក្នុងការបញ្ជាក់អ្វីមួយជាក់ស្តែងនៅក្នុងការសន្និដ្ឋាន ដែលមិនតម្រូវឱ្យមានការស្រាវជ្រាវពិសេសដើម្បីបង្កើត។ ឧទាហរណ៍៖

"នៅក្នុងថ្នាក់លំហាត់ប្រាណជាមួយសិស្សសាលា ចាំបាច់ត្រូវគិតគូរពីលក្ខណៈនៃការអភិវឌ្ឍន៍របស់ក្មេងជំទង់នៅអាយុនេះ"។

ពេលខ្លះការសន្និដ្ឋានប្រែទៅជាគ្មានន័យទាំងស្រុង។ នេះជាធម្មតាជាការសន្និដ្ឋានដំបូងដែលសិស្សធ្វើដោយផ្អែកលើការវិភាគនៃអក្សរសិល្ប៍។ ឧទាហរណ៍៖

"ការវិភាគនៃអក្សរសិល្ប៍វិទ្យាសាស្រ្ត និងវិធីសាស្រ្តបានបង្ហាញថា នៅក្នុងទ្រឹស្ដីនៃការអប់រំកាយ បញ្ហានៃការប្រើប្រាស់ម៉ាស៊ីនក្លែងធ្វើក្នុងការហ្វឹកហាត់កីឡារបស់អ្នកហែលទឹកមិនទាន់ត្រូវបានដោះស្រាយយ៉ាងពេញលេញនៅឡើយទេ។"

ការសន្និដ្ឋានគួរតែឆ្លុះបញ្ចាំងជាព័ត៌មានអំពីការងារដែលធ្វើដោយសិស្ស ប៉ុន្តែមិនគួរប្រើពាក្យសំដីទេ។


តម្រូវការសម្រាប់ការចុះឈ្មោះ

វគ្គសិក្សាការងារ

ការងារជម្រុះចុងក្រោយត្រូវតែរួមបញ្ចូលធាតុផ្សំរចនាសម្ព័ន្ធដូចខាងក្រោមៈ

· ទំព័រមុខ;

· សេចក្តីផ្តើម;

· អត្ថបទចម្បង(ជំពូកទី១ ជំពូក២);

· ការសន្និដ្ឋាន (សេចក្តីសន្និដ្ឋាន);

· បញ្ជីឯកសារយោង;

· កម្មវិធី(ប្រសិនបើមានតម្រូវការសម្រាប់ពួកគេ) ។

បរិមាណល្អបំផុតនៃមេរៀនគឺ 40-50 ទំព័រនៃអត្ថបទសរសេរបន្ទាប់ពី 1 ,5 ចន្លោះពេល (រួមទាំងតួលេខ តារាង ក្រាហ្វ គន្ថនិទ្ទេស និងឧបសម្ព័ន្ធ)។

ទំហំពុម្ពអក្សរ 14 Times New Roman ។

ការងារត្រូវបានរៀបចំជាទម្រង់កុំព្យូទ័រ ឬសរសេរដោយដៃ (ជម្រើសទីពីរគឺមិនសូវចង់បាន)។

នៅក្នុងកំណែកុំព្យូទ័រអត្ថបទនៃការងារត្រូវបានបោះពុម្ពនៅចន្លោះពេលមួយនិងពាក់កណ្តាលនៅផ្នែកម្ខាងនៃសន្លឹកស្តង់ដារនៃក្រដាស A4 (210x297 មម) ។ រឹមនៃទំព័រការងារត្រូវតែមានទំហំដូចខាងក្រោម: ឆ្វេង - 30 មម, ស្តាំ - 10 មម, កំពូល - 20 មម, បាត - 25 ម។

តារាង រូបភាព គំនូរ ដ្យាក្រាម ក្រាហ្វ ត្រូវធ្វើនៅលើសន្លឹក A4 ស្តង់ដារ (210x297 មម)។ ហត្ថលេខា និងការពន្យល់ត្រូវតែនៅផ្នែកខាងមុខ។

ទំព័រទាំងអស់នៃការងារវិញ្ញាបនប័ត្រចុងក្រោយ រួមទាំងរូបភាព និងឧបសម្ព័ន្ធ ត្រូវបានដាក់លេខតាមលំដាប់លំដោយពីទំព័រចំណងជើងទៅទំព័រចុងក្រោយដោយមិនមានការរំលង ឬពាក្យដដែលៗ។ ទំព័រទីមួយត្រូវបានចាត់ទុកថាជាទំព័រចំណងជើង លេខ "1" មិនត្រូវបានដាក់នៅលើវាទេ លេខ "2" ត្រូវបានដាក់នៅទំព័របន្ទាប់។ល។ លេខសៀរៀលត្រូវបានដាក់នៅចំកណ្តាលរឹមខាងក្រោមនៃទំព័រ។

សម្ភារៈទាំងអស់នៃវិញ្ញាបនប័ត្រចុងក្រោយដំណើរការស្របតាមតារាងមាតិកា (ផែនការ) ត្រូវបានបែងចែកជាកថាខណ្ឌ។ ឈ្មោះ​កថាខណ្ឌ​ត្រូវ​តែ​ត្រូវ​គ្នា​នឹង​ខ្លឹមសារ ហើយ​ត្រូវ​បាន​បោះពុម្ព​ជា​ក្បាល​អក្សរ​តូច​ដោយ​មិន​គូស​ក្រោម។

នៅក្នុងការងារ ស្តង់ដារជាទូទៅទទួលយកអក្សរកាត់ដូចជា "etc.," "etc.," "etc.," ជាដើមគឺអាចទទួលយកបាន។ "ល។" "មើល" "ទំព័រ" ។

ការរចនាគំរូនៃតារាង និងរូបភាពត្រូវបានផ្តល់ឱ្យនៅក្នុងឧបសម្ព័ន្ធទី 3 ។

ទំព័រមុខ

ទំព័រចំណងជើងគឺជាព័ត៌មានអំពីការងារ។ វាបង្ហាញពីឈ្មោះស្ថាប័នដែលការងារត្រូវបានអនុវត្ត; នាមត្រកូល, ឈ្មោះដំបូង, បុព្វហេតុរបស់អ្នកនិពន្ធ; ឈ្មោះ; នាមត្រកូល នាមត្រកូល បរិញ្ញាបត្ររង សញ្ញាបត្រសិក្សា និងចំណងជើងសិក្សារបស់ប្រធានផ្នែកវិទ្យាសាស្ត្រ (ទីប្រឹក្សា); ទីក្រុង, ឆ្នាំ ទំព័រចំណងជើងនៃការងារបញ្ជាក់ចុងក្រោយត្រូវបានបង្ហាញក្នុងរូបភាពទី 1 ។

ស្ថាប័នអប់រំស្វយ័តរដ្ឋសហព័ន្ធ

ការអប់រំខ្ពស់។

"សាកលវិទ្យាល័យ Nizhny Novgorod State បានដាក់ឈ្មោះតាម។ N.I. Lobachevsky"

សាខា Arzamas

មហាវិទ្យាល័យភូមិសាស្ត្រធម្មជាតិ

នាយកដ្ឋានវប្បធម៌រាងកាយ

កម្មសិក្សាក្នុងវិន័យ

"ទ្រឹស្តី និងវិធីសាស្រ្តនៃវប្បធម៌រូបវន្ត"

លើប្រធានបទ៖

"លក្ខណៈវិធីសាស្រ្តនៃការអប់រំកាយ និងថ្នាក់សុខភាព

ជាមួយកុមារមត្តេយ្យសិក្សា"

បានបញ្ចប់៖

Ivanov A.V.,

ទិសដៅសិស្ស 034300 (49.03.01)

វប្បធម៌រាងកាយ

ប្រវត្តិរូប "ការគ្រប់គ្រងក្នុងវិស័យ

វប្បធម៌រាងកាយ"

ទម្រង់នៃការអប់រំ - ការឆ្លើយឆ្លង

(ពេញម៉ោងសិក្សា/

កម្មវិធីបណ្តុះបណ្តាបង្កើនល្បឿន)

១ (២) វគ្គសិក្សា ក្រុមទី ១១(១២)

អ្នកគ្រប់គ្រងវិទ្យាសាស្ត្រ៖

បណ្ឌិត សាស្ត្រាចារ្យរង Sidorova T.V.

អាហ្សាម៉ា

អង្ករ។ ទំព័រចំណងជើងគំរូនៃក្រដាសពាក្យ

នៅក្នុងឯកសារបញ្ជាក់ចុងក្រោយ ពាក្យ "តារាងមាតិកា" ត្រូវបានប្រើ មិនមែន "មាតិកា" ទេ។ តារាងមាតិកាគឺជាលិបិក្រមនៃចំណងជើង (ជំពូក) នៃការងារតែមួយ ខណៈពេលដែល មាតិកាគឺជាលិបិក្រមនៃចំណងជើងនៃស្នាដៃផ្សេងៗដែលមាននៅក្នុងការបោះពុម្ពផ្សាយ។ តាមទស្សនៈនៃវប្បធម៌អាន តារាងមាតិកាត្រូវបានដាក់នៅដើមដំបូងនៃការងារ៖ អ្នកអានចាប់ផ្តើមស្គាល់ការសិក្សាពីតារាងមាតិកា។

នៅពេលរចនាតារាងមាតិកា ចំណងជើងរងនីមួយៗត្រូវតែចូលបន្ទាត់នៅខាងស្តាំនៃក្បាលមេមុនដែលវាទាក់ទង ដោយដាក់លេខទីមួយនៅក្រោមអក្សរធំនៃក្បាលដែលវាទាក់ទងដោយផ្ទាល់។ ក្បាលទាំងអស់នៃកម្រិតស្មើគ្នាគួរតែចាប់ផ្តើមពីបន្ទាត់បញ្ឈរដូចគ្នា។ ផែនការបែបនេះអនុញ្ញាតឱ្យអ្នកមើលឃើញយ៉ាងច្បាស់នូវភាពអនុលោមនៃសម្ភារៈទាំងអស់។ ឧទាហរណ៍៖

សេចក្តីផ្តើម។ . . . . . . . . . . . . . . . . . . . . . . ... . . . ... . . . . . . . . . . . . . . . . . . . . . . . . . . .
បញ្ហានៃការអភិវឌ្ឍចំណេះដឹងក្នុងចំណោមសិស្សដើម្បីបង្កើនការលើកទឹកចិត្តរបស់ពួកគេក្នុងការចូលរួមក្នុងការធ្វើលំហាត់ប្រាណ។ . . . …………... . .
1. វប្បធម៌រាងកាយរបស់សិស្សនៅដំណាក់កាលបច្ចុប្បន្ន។ . . . …………..
1.11.1 ការផ្លាស់ប្តូរអាទិភាពក្នុងការធ្វើលំហាត់ប្រាណរបស់សិស្សក្នុងទសវត្សរ៍ទី 20-90 ។ . . . . . . . ………..
1.1 1.2 ទិសដៅនៃការអប់រំទំនើបរបស់និស្សិតក្នុងវិស័យវប្បធម៌រូបវន្ត។ . . . . . . . …………
2. ការបង្កើតការលើកទឹកចិត្តរបស់សិស្សក្នុងការចូលរួមក្នុងលំហាត់រាងកាយ។ . . . . . . . . . . . . . . . . . . . ………
2.12.2 អាកប្បកិរិយារបស់សិស្សចំពោះការធ្វើលំហាត់ប្រាណ។
សេចក្តីសន្និដ្ឋាន ……………………………………………………………………. ១៤
ឯកសារយោង……………………………………………………………………………………………
កម្មវិធី

ដើម្បីធ្វើឱ្យការចូលបន្ទាត់ក្នុងតារាងមាតិកាដូចគ្នា និងតម្រឹមលេខទំព័រ គួរតែប្រើទម្រង់តារាង ដែលបន្ទាត់ត្រូវបានកំណត់ក្នុងប៉ារ៉ាម៉ែត្រដើម្បីមើលមិនឃើញ។

នៅក្នុងការងារបញ្ជាក់ចុងក្រោយ ការកំណត់អត្ថបទគឺមានសារៈសំខាន់ណាស់។ Rubrics បង្ហាញពីរចនាសម្ព័ន្ធនៃអត្ថបទ បង្ហាញពីការតភ្ជាប់ និងការពឹងពាក់គ្នាទៅវិញទៅមកនៃផ្នែក និងផ្នែករង។

ក្បាលកថាខណ្ឌត្រូវតែឆ្លុះបញ្ចាំងយ៉ាងត្រឹមត្រូវនូវខ្លឹមសារនៃអត្ថបទដែលទាក់ទងនឹងពួកគេ។ ពួកគេមិនគួរកាត់បន្ថយ ឬពង្រីកបរិមាណនៃព័ត៌មាន semantic ដែលមាននៅក្នុងពួកគេ។

ក្បាលកថាខណ្ឌ និងកថាខណ្ឌរងមានទីតាំងនៅកណ្តាលបន្ទាត់ដាច់ដោយឡែក ហើយត្រូវបានបោះពុម្ពជាអក្សរដិត ត្រង់ អក្សរតូច លើកលែងតែអក្សរធំទីមួយ (រូបទី 2)។

១.១. គំនិតនៃឥរិយាបថ

អង្ករ។ 2. ឧទាហរណ៍នៃចំណងជើងកថាខណ្ឌ

ចំណងជើងត្រូវបានបំបែកចេញពីអត្ថបទបន្ទាប់ដោយដកឃ្លាមួយ (តួអក្សរដែលមិនបោះពុម្ពមួយ) និងពីអត្ថបទមុនដោយដកឃ្លាពីរ (តួអក្សរមិនបោះពុម្ពពីរមួយនៅខាងក្រោមផ្សេងទៀត) ។ ចំណងជើងមិនអាចជាបន្ទាត់ចុងក្រោយនៅលើទំព័របានទេ។

ការចូលបន្ទាត់កថាខណ្ឌត្រូវបានកំណត់ដោយជម្រើស “Format” ® “Paragraph” ® “Indents and Spacing” ® “First Line” ® “Indentation” ® 1.25 cm (1.27 cm)។ ការ​ចូល​បន្ទាត់​កថាខណ្ឌ​មិន​អាច​ត្រូវ​បាន​កំណត់​ដោយ​ការ​ចុច​គ្រាប់ចុច​ទេ!

ការបន្លិចពុម្ពអក្សរ

ការអនុលោមតាមខ្លឹមសារក្នុងកថាខណ្ឌមួយ ការកំណត់ផ្នែក និងធាតុនៃអត្ថបទដោយសារៈសំខាន់ ត្រូវបានធ្វើជាផ្លូវការដោយប្រើពុម្ពអក្សរមួយ (មានទម្ងន់ខុសគ្នាជាមួយនឹងគំនូសនៃអក្សរដែលរអិលតាមលំដាប់លេខ)។

នៅក្នុងស្នាដៃវិទ្យាសាស្ត្រ វាជាទម្លាប់ក្នុងការប្រើអក្សរតូចតាច (តារាងទី ១១)។

Paired Student's t-test គឺ​ជា​ការ​កែប្រែ​មួយ​នៃ​វិធីសាស្ត្រ​របស់​សិស្ស ដែល​ត្រូវ​បាន​ប្រើ​ដើម្បី​កំណត់​ពី​សារៈសំខាន់​ស្ថិតិ​នៃ​ភាព​ខុស​គ្នា​ក្នុង​ការ​វាស់​ជា​គូ (ម្តង​ហើយ​ម្តង​ទៀត)។

1. ប្រវត្តិនៃការអភិវឌ្ឍន៍នៃការធ្វើតេស្ត t

t-test ត្រូវបានបង្កើតឡើង លោក William Gossettដើម្បីវាយតម្លៃគុណភាពនៃស្រាបៀរនៅក្នុងក្រុមហ៊ុន Guinness ។ ដោយសារកាតព្វកិច្ចចំពោះក្រុមហ៊ុនទាក់ទងនឹងការមិនបង្ហាញអាថ៌កំបាំងពាណិជ្ជកម្ម អត្ថបទរបស់ Gosset ត្រូវបានបោះពុម្ពនៅឆ្នាំ 1908 នៅក្នុងទិនានុប្បវត្តិ Biometrics ក្រោមឈ្មោះក្លែងក្លាយ "សិស្ស" ។

2. តើតេស្ត t-test របស់សិស្សដែលផ្គូផ្គងប្រើសម្រាប់អ្វី?

Paired Student's t-test ត្រូវបានប្រើសម្រាប់ការប្រៀបធៀប គំរូដែលពឹងផ្អែកពីរ (គូ). ការវាស់វែងអាស្រ័យលើអ្នកជំងឺដូចគ្នា ប៉ុន្តែនៅពេលផ្សេងគ្នា ឧទាហរណ៍ សម្ពាធឈាមចំពោះអ្នកជំងឺលើសឈាម មុន និងក្រោយលេបថ្នាំប្រឆាំងនឹងសម្ពាធឈាម។ សម្មតិកម្មគ្មានន័យបញ្ជាក់ថាមិនមានភាពខុសគ្នារវាងគំរូដែលត្រូវបានប្រៀបធៀបទេ សម្មតិកម្មជំនួសបញ្ជាក់ថាមានភាពខុសគ្នាសំខាន់ៗតាមស្ថិតិ។

3. តើក្នុងករណីណាខ្លះដែលអ្នកអាចប្រើ t-test របស់សិស្សដែលបានផ្គូផ្គង?

លក្ខខណ្ឌចម្បងគឺ ភាពអាស្រ័យគំរូនោះគឺតម្លៃប្រៀបធៀបត្រូវតែទទួលបានពីការវាស់វែងម្តងហើយម្តងទៀតនៃប៉ារ៉ាម៉ែត្រមួយ។

ដូចនៅក្នុងករណីនៃការប្រៀបធៀបនៃសំណាកឯករាជ្យ ដើម្បីប្រើការធ្វើតេស្ត T-test ដែលផ្គូផ្គង វាចាំបាច់ដែលទិន្នន័យដើមមាន ការចែកចាយធម្មតា។. ប្រសិនបើលក្ខខណ្ឌនេះមិនត្រូវបានបំពេញទេ វិធីសាស្ត្រគួរតែត្រូវបានប្រើដើម្បីប្រៀបធៀបមធ្យោបាយគំរូ ស្ថិតិមិនមែនប៉ារ៉ាម៉ែត្រ, ដូចជា ការធ្វើតេស្ត G-signនិង ការធ្វើតេស្ត Wilcoxon T.

ការធ្វើតេស្ត t-paired អាចប្រើបានតែនៅពេលប្រៀបធៀបប៉ុណ្ណោះ។ ពីរគំរូ។ ប្រសិនបើអ្នកត្រូវការប្រៀបធៀប បី ឬច្រើនជាងនេះ។ការវាស់វែងម្តងហើយម្តងទៀតគួរតែត្រូវបានប្រើ ANOVA ផ្លូវមួយសម្រាប់វិធានការម្តងហើយម្តងទៀត.

4. តើធ្វើដូចម្តេចដើម្បីគណនា t-test របស់សិស្សដែលបានផ្គូផ្គង?

ការធ្វើតេស្ត t របស់សិស្សដែលបានផ្គូផ្គងត្រូវបានគណនាដោយប្រើរូបមន្តខាងក្រោម៖

កន្លែងណា ម ឃ - មធ្យមនព្វន្ធនៃភាពខុសគ្នារវាងសូចនាករដែលបានវាស់វែងមុន និងក្រោយ, σd - គម្លាតស្តង់ដារនៃភាពខុសគ្នានៅក្នុងសូចនាករ - ចំនួនមុខវិជ្ជាដែលបានសិក្សា។

5. តើធ្វើដូចម្តេចដើម្បីបកស្រាយតម្លៃ t-test របស់សិស្ស?

ការបកស្រាយលទ្ធផលនៃតម្លៃតេស្ត t របស់សិស្សដែលបានផ្គូផ្គងមិនខុសពីការវាយតម្លៃនៃការធ្វើតេស្ត t សម្រាប់ចំនួនប្រជាជនដែលមិនពាក់ព័ន្ធនោះទេ។ ដំបូងអ្នកត្រូវស្វែងរកចំនួនដឺក្រេនៃសេរីភាព f យោងតាមរូបមន្តខាងក្រោម៖

f = n − ១

បន្ទាប់ពីនេះ យើងកំណត់តម្លៃសំខាន់នៃការធ្វើតេស្ត t របស់សិស្សសម្រាប់កម្រិតនៃសារៈសំខាន់ដែលត្រូវការ (ឧទាហរណ៍ ទំ<0,05) и при данном числе степеней свободы f យោងតាមតារាង ( សូមមើលខាងក្រោម).

យើងប្រៀបធៀបតម្លៃសំខាន់ៗ និងគណនានៃលក្ខណៈវិនិច្ឆ័យ៖

  • ប្រសិនបើតម្លៃគណនានៃ t-test របស់សិស្សដែលបានផ្គូផ្គង ស្មើ ឬធំជាងសំខាន់ដែលបានរកឃើញពីតារាងយើងសន្និដ្ឋានថាភាពខុសគ្នារវាងតម្លៃប្រៀបធៀបគឺមានសារៈសំខាន់ស្ថិតិ។
  • ប្រសិនបើតម្លៃនៃ t-test របស់សិស្សដែលបានគណនា តិច tabular ដែល​មាន​ន័យ​ថា​ភាព​ខុស​គ្នា​រវាង​តម្លៃ​ដែល​បាន​ប្រៀប​ធៀប​គឺ​មិន​សំខាន់​តាម​ស្ថិតិ។

6. ឧទាហរណ៍នៃការគណនា t-test របស់សិស្ស

ដើម្បីវាយតម្លៃប្រសិទ្ធភាពនៃភ្នាក់ងារជាតិស្ករក្នុងឈាមថ្មី កម្រិតជាតិស្ករក្នុងឈាមត្រូវបានវាស់ចំពោះអ្នកជំងឺដែលមានជំងឺទឹកនោមផ្អែមមុន និងក្រោយពេលប្រើថ្នាំ។ ជាលទ្ធផល ទិន្នន័យខាងក្រោមត្រូវបានទទួល៖

ដំណោះស្រាយ៖

1. គណនាភាពខុសគ្នានៃតម្លៃគូនីមួយៗ ( ):

អ្នកជំងឺ N កម្រិតជាតិស្ករក្នុងឈាម mmol/l ភាពខុសគ្នា (d)
មុនពេលប្រើថ្នាំ បន្ទាប់ពីប្រើថ្នាំ
1 9.6 5.7 3.9
2 8.1 5.4 2.7
3 8.8 6.4 2.4
4 7.9 5.5 2.4
5 9.2 5.3 3.9
6 8.0 5.2 2.8
7 8.4 5.1 3.3
8 10.1 6.9 3.2
9 7.8 7.5 2.3
10 8.1 5.0 3.1

2. រកមធ្យមនព្វន្ធនៃភាពខុសគ្នាដោយប្រើរូបមន្ត៖

3. ស្វែងរកគម្លាតស្តង់ដារនៃភាពខុសគ្នាពីមធ្យមដោយប្រើរូបមន្ត៖

4. គណនា t-test របស់សិស្សដែលបានផ្គូផ្គង៖

5. ចូរយើងប្រៀបធៀបតម្លៃដែលទទួលបាននៃ t-test 8.6 របស់សិស្សជាមួយនឹងតម្លៃតារាង ដែលជាមួយនឹងចំនួនដឺក្រេនៃសេរីភាព fស្មើនឹង 10 - 1 = 9 ហើយកម្រិតសារៈសំខាន់ p = 0.05 គឺ 2.262 ។ ដោយសារតម្លៃដែលទទួលបានគឺធំជាងតម្លៃសំខាន់ យើងសន្និដ្ឋានថាមានភាពខុសប្លែកគ្នាយ៉ាងសំខាន់ក្នុងស្ថិតិនៃកម្រិតជាតិស្ករក្នុងឈាមមុន និងក្រោយពេលប្រើថ្នាំថ្មី។

ភារកិច្ចទូទៅបំផុតនៅក្នុងការស្រាវជ្រាវផ្លូវចិត្តគឺដើម្បីកំណត់ភាពខុសគ្នារវាងក្រុមពីរឬច្រើន។ ការកំណត់អត្តសញ្ញាណនៃភាពខុសគ្នាបែបនេះនៅកម្រិតនៃមធ្យោបាយនព្វន្ធត្រូវបានពិចារណាក្នុងនីតិវិធីសម្រាប់ការវិភាគស្ថិតិបឋម។ ទោះជាយ៉ាងណាក៏ដោយ សំណួរកើតឡើងថាតើភាពខុសគ្នាទាំងនេះអាចទុកចិត្តបានប៉ុណ្ណា និងថាតើពួកគេអាចពង្រីកបាន (extrapolated) ដល់ប្រជាជនទាំងមូលដែរឬទេ។ ដើម្បីដោះស្រាយបញ្ហានេះ ភាគច្រើនគេប្រើ (សន្មត់ថាធម្មតា ឬជិតនឹងការចែកចាយធម្មតា) t - លក្ខណៈវិនិច្ឆ័យ (ការធ្វើតេស្តរបស់សិស្ស) ដែលមានបំណងស្វែងរកថាតើសូចនាករដែលអាចទុកចិត្តបាននៃគំរូនៃមុខវិជ្ជាមួយខុសគ្នាពីអ្វីផ្សេងទៀត (ឧទាហរណ៍៖ នៅពេលដែលមុខវិជ្ជាទទួលបានលទ្ធផលនៃការធ្វើតេស្តក្រុមមួយមានពិន្ទុខ្ពស់ជាងអ្នកតំណាងផ្សេងទៀត) ។ នេះគឺជាលក្ខណៈវិនិច្ឆ័យប៉ារ៉ាម៉ែត្រ និងមានទម្រង់សំខាន់ពីរ៖

1) unrelated (សេស) t - ការធ្វើតេស្តដែលបានរចនាឡើងដើម្បីរកមើលថាតើមានភាពខុសគ្នារវាងពិន្ទុដែលទទួលបាននៅពេលប្រើតេស្តដូចគ្នាដើម្បីសាកល្បងក្រុមពីរដែលបង្កើតឡើងពីមនុស្សផ្សេងគ្នា។ ជាឧទាហរណ៍ នេះអាចជាការប្រៀបធៀបនៃកម្រិតនៃភាពវៃឆ្លាត ឬស្ថេរភាពនៃសរសៃប្រសាទ ការថប់បារម្ភរបស់សិស្សដែលជោគជ័យ និងមិនបានជោគជ័យ ឬការប្រៀបធៀបសិស្សនៃថ្នាក់ផ្សេងៗគ្នា អាយុ កម្រិតសង្គម និងលក្ខណៈផ្សេងទៀតលើលក្ខណៈទាំងនេះ។ វាអាចមានសំណាកនៃភេទផ្សេងគ្នា សញ្ជាតិផ្សេងគ្នា ក៏ដូចជាគំរូរងនៅក្នុងគំរូដែលបានសិក្សា ត្រូវបានកំណត់តាមលក្ខណៈជាក់លាក់មួយ។ លក្ខណៈវិនិច្ឆ័យត្រូវបានគេហៅថា "មិនទាក់ទង" ដោយសារតែក្រុមដែលត្រូវបានប្រៀបធៀបត្រូវបានបង្កើតឡើងពីមនុស្សផ្សេងគ្នា;

2) ភ្ជាប់ (គូ) t - ការធ្វើតេស្តប្រើដើម្បីប្រៀបធៀបសូចនាករនៃក្រុមពីររវាងធាតុដែលមានការតភ្ជាប់ជាក់លាក់។ នេះមានន័យថាធាតុនីមួយៗនៃក្រុមទីមួយត្រូវគ្នាទៅនឹងធាតុនៃក្រុមទីពីរដែលស្រដៀងនឹងវាយោងទៅតាមប៉ារ៉ាម៉ែត្រជាក់លាក់នៃចំណាប់អារម្មណ៍ចំពោះអ្នកស្រាវជ្រាវ។ ភាគច្រើនជាញឹកញាប់ ប៉ារ៉ាម៉ែត្រនៃបុគ្គលដូចគ្នាត្រូវបានប្រៀបធៀបមុន និងក្រោយព្រឹត្តិការណ៍ ឬសកម្មភាពជាក់លាក់មួយ (ឧទាហរណ៍ ក្នុងអំឡុងពេលសិក្សាបណ្តោយ ឬការពិសោធន៍ទ្រង់ទ្រាយ)។ ដូច្នេះ លក្ខណៈវិនិច្ឆ័យនេះត្រូវបានប្រើដើម្បីប្រៀបធៀបការអនុវត្តរបស់បុគ្គលដូចគ្នាមុន និងក្រោយការស្ទង់មតិ ការពិសោធន៍ ឬបន្ទាប់ពីពេលវេលាជាក់លាក់ណាមួយ។

ប្រសិនបើទិន្នន័យមិនមែនជាកម្មវត្ថុនៃការចែកចាយធម្មតាទេ សូមប្រើការធ្វើតេស្ត nonparametric ស្មើនឹងការធ្វើតេស្ត t: ការធ្វើតេស្ត Mann-Whitney ដែលស្មើនឹងការធ្វើតេស្តសេស t និងការធ្វើតេស្ត Wilcoxon គំរូពីរ ស្មើនឹងការធ្វើតេស្ត t-paired ។

ដោយប្រើតេស្ត t និងសមមូលមិនប៉ារ៉ាម៉ែត្ររបស់ពួកគេ អ្នកអាចប្រៀបធៀបលទ្ធផលនៃក្រុមពីរដែលទទួលបានដោយប្រើតេស្តដូចគ្នា។ ទោះយ៉ាងណាក៏ដោយក្នុងករណីខ្លះវាចាំបាច់ដើម្បីប្រៀបធៀបក្រុមជាច្រើនឬការវាយតម្លៃនៃប្រភេទជាច្រើន។ នេះអាចត្រូវបានធ្វើជាដំណាក់កាលដោយបែងចែកភារកិច្ចទៅជាគូជាច្រើននៃការប្រៀបធៀប (ឧទាហរណ៍ប្រសិនបើអ្នកត្រូវការប្រៀបធៀបក្រុម A, B និង Y យោងតាមលទ្ធផលនៃការធ្វើតេស្ត X និង Y បន្ទាប់មកដោយប្រើតេស្ត t អ្នកអាចប្រៀបធៀបជាមុនសិន។ ក្រុម A និង B យោងទៅតាមលទ្ធផលនៃការធ្វើតេស្ត X បន្ទាប់មក A និង B ផ្អែកលើលទ្ធផលនៃការធ្វើតេស្ត C, A និង C ដោយផ្អែកលើលទ្ធផលនៃការធ្វើតេស្ត X ។ ទោះជាយ៉ាងណាក៏ដោយ នេះគឺជាវិធីសាស្ត្រដែលពឹងផ្អែកខ្លាំងលើកម្លាំងពលកម្ម ដូច្នេះពួកគេងាកទៅរកវិធីសាស្ត្រស្មុគ្រស្មាញនៃការវិភាគភាពប្រែប្រួល។

វិធីសាស្រ្តវាយតម្លៃភាពអាចជឿជាក់បាននៃភាពខុសគ្នានៃមធ្យោបាយនព្វន្ធ ដោយប្រើតេស្តប៉ារ៉ាម៉ែត្រដែលមានប្រសិទ្ធភាពដោយសិស្សមានគោលបំណងដោះស្រាយបញ្ហាមួយក្នុងចំណោមបញ្ហាដែលគេសង្កេតឃើញញឹកញាប់បំផុតក្នុងអំឡុងពេលដំណើរការទិន្នន័យ - កំណត់អត្តសញ្ញាណភាពជឿជាក់នៃភាពខុសគ្នារវាងតម្លៃស៊េរីពីរ ឬច្រើន។ ការវាយតម្លៃបែបនេះច្រើនតែចាំបាច់ក្នុងការវិភាគប្រៀបធៀបនៃក្រុមប៉ូល។ ពួកគេត្រូវបានសម្គាល់ដោយផ្អែកលើការបង្ហាញផ្សេងៗគ្នានៃសញ្ញាគោលដៅជាក់លាក់មួយ (លក្ខណៈ) នៃបាតុភូតដែលកំពុងសិក្សា។ តាមក្បួនការវិភាគចាប់ផ្តើមដោយការគណនាស្ថិតិបឋមនៃក្រុមដែលបានជ្រើសរើសបន្ទាប់មកសារៈសំខាន់នៃភាពខុសគ្នាត្រូវបានវាយតម្លៃលក្ខណៈវិនិច្ឆ័យរបស់សិស្សត្រូវបានគណនាដោយប្រើរូបមន្ត។

តម្លៃនៃការធ្វើតេស្តរបស់សិស្សសម្រាប់កម្រិតនៃភាពជឿជាក់បីកម្រិត (ស្ថិតិ) សារៈសំខាន់ (p) ត្រូវបានផ្តល់ឱ្យនៅក្នុងសៀវភៅយោងស្តីពីស្ថិតិគណិតវិទ្យា។ ចំនួនដឺក្រេនៃសេរីភាពត្រូវបានកំណត់ដោយរូបមន្ត៖

ជាមួយនឹងការថយចុះទំហំគំរូ (n<10) критерий Стьюдента становится чувствительным к форме распределения исследуемого признака в генеральной совокупности. Поэтому в сомнительных случаях рекомендуют использовать непараметрические методы или сравнивать полученные значения с критическими (табл. 2.17) для высшего уровня значимости.

ការសម្រេចចិត្តលើភាពជឿជាក់នៃភាពខុសគ្នាត្រូវបានធ្វើឡើងប្រសិនបើតម្លៃ t ដែលបានគណនាលើសពីតម្លៃតារាងសម្រាប់ចំនួនជាក់លាក់នៃដឺក្រេនៃសេរីភាព (d (v)) ។ ការបោះពុម្ពផ្សាយ ឬរបាយការណ៍វិទ្យាសាស្ត្របង្ហាញពីកម្រិតខ្ពស់នៃសារៈសំខាន់ក្នុងចំណោមបី៖ ទំ<0,05; р <0,01; р <0,001.

សម្រាប់តម្លៃលេខណាមួយនៃលក្ខណៈវិនិច្ឆ័យសម្រាប់ភាពជឿជាក់នៃភាពខុសគ្នារវាងមធ្យោបាយ សូចនាករនេះមិនវាយតម្លៃកម្រិតនៃភាពខុសគ្នាដែលបានកំណត់ទេ (វាត្រូវបានវាយតម្លៃដោយភាពខុសគ្នារវាងមធ្យោបាយដោយខ្លួនឯង) ប៉ុន្តែមានតែភាពជឿជាក់នៃស្ថិតិរបស់វាប៉ុណ្ណោះ ពោលគឺ សិទ្ធិក្នុងការពង្រីកការសន្និដ្ឋានដែលទទួលបានដោយផ្អែកលើការប្រៀបធៀបគំរូអំពីវត្តមាននៃភាពខុសគ្នាទៅនឹងបាតុភូតទាំងមូល (ដំណើរការទាំងមូល) ទាំងមូល។ លក្ខណៈវិនិច្ឆ័យនៃភាពខុសគ្នាដែលបានគណនាទាបមិនអាចធ្វើជាភស្តុតាងនៃអវត្តមាននៃភាពខុសគ្នារវាងលក្ខណៈពីរ (បាតុភូត) ទេ ពីព្រោះសារៈសំខាន់របស់វា (កម្រិតនៃភាពអាចជឿជាក់បាន) មិនត្រឹមតែអាស្រ័យទៅលើទំហំមធ្យមប៉ុណ្ណោះទេ ប៉ុន្តែក៏មានលើចំនួនគំរូដែលត្រូវបានប្រៀបធៀបផងដែរ។ វាមិនបង្ហាញពីអវត្តមាននៃភាពខុសគ្នានោះទេ ប៉ុន្តែការពិតដែលថាជាមួយនឹងទំហំគំរូបែបនេះ វាមិនគួរឱ្យទុកចិត្តបានតាមស្ថិតិទេ៖ មានឱកាសខ្ពស់ណាស់ដែលភាពខុសគ្នានៃលក្ខខណ្ឌទាំងនេះគឺចៃដន្យ ប្រូបាប៊ីលីតេនៃភាពជឿជាក់របស់វាទាបណាស់។

តារាង 2.17 ។ ដែនកំណត់ទំនុកចិត្តសម្រាប់ការធ្វើតេស្តរបស់សិស្ស (t-test) សម្រាប់ f ដឺក្រេនៃសេរីភាព

ការផ្លាស់ប្តូរពេលវេលាជាមធ្យមដើម្បីបញ្ចប់កិច្ចការនៅក្នុងការសាកល្បងលើកទីពីរ (បើប្រៀបធៀបទៅនឹងការសាកល្បងលើកទីមួយ) គឺមិនគួរឱ្យទុកចិត្តទេ។

កន្សោមនេះមិនស្មើនឹងសេចក្តីថ្លែងការណ៍អំពីភាពដូចគ្នានៃស្ថិតិនៃគំរូទាំងពីរដែលកំពុងត្រូវបានប្រៀបធៀបនោះទេ។ លើសពីនេះ ការអនុវត្តលក្ខណៈវិនិច្ឆ័យរបស់សិស្សក្នុងករណីគំរូមិនស្មើគ្នាបែបនេះគឺមិនត្រឹមត្រូវទាំងស្រុងតាមគណិតវិទ្យា ហើយពិតណាស់ប៉ះពាល់ដល់ភាពមិនគួរឱ្យទុកចិត្តចុងក្រោយនៃភាពខុសគ្នារវាង Xav = 9.1 និង Xav = 8.5 ។ ដោយប្រើលក្ខណៈវិនិច្ឆ័យនេះ មនុស្សម្នាក់មិនវាយតម្លៃកម្រិតនៃភាពស្និទ្ធស្នាលនៃមធ្យមភាគពីរទេ ប៉ុន្តែពិចារណាលើការចាត់តាំង ឬ seine នៃភាពចៃដន្យ (ក្នុងកម្រិតនៃសារៈសំខាន់)។ .

ដែល f គឺជាកម្រិតនៃសេរីភាព ដែលត្រូវបានកំណត់ជា

ឧទាហរណ៍ .

សិស្សពីរក្រុមត្រូវបានបណ្តុះបណ្តាលដោយប្រើវិធីពីរផ្សេងគ្នា។ នៅចុងបញ្ចប់នៃការបណ្តុះបណ្តាល ពួកគេត្រូវបានផ្តល់ការធ្វើតេស្តពេញមួយវគ្គ។

វាចាំបាច់ក្នុងការវាយតម្លៃថាតើភាពខុសគ្នាខ្លាំងនៃចំណេះដឹងដែលទទួលបានមានកម្រិតណា។ លទ្ធផលតេស្តត្រូវបានបង្ហាញនៅក្នុងតារាងទី 4 ។

តារាងទី 4

ចូរយើងគណនាជាមធ្យមគំរូ បំរែបំរួល និងគម្លាតស្តង់ដារ៖

ចូរកំណត់តម្លៃនៃ t p ដោយប្រើរូបមន្ត t p = 0.45<2,88 гипотеза Но подтверждается и существенных различий в методиках обучения нет на уровне значимости 0,01.

ដោយប្រើតារាងទី 1 (សូមមើលឧបសម្ព័ន្ធ) យើងរកឃើញតម្លៃសំខាន់ t k សម្រាប់កម្រិតសារៈសំខាន់ p = 0.01

សេចក្តីសន្និដ្ឋាន៖ ចាប់តាំងពីតម្លៃដែលបានគណនានៃលក្ខណៈវិនិច្ឆ័យគឺតិចជាងតម្លៃសំខាន់នៃ 0.45

ក្បួនដោះស្រាយសម្រាប់ការគណនា t-test របស់សិស្សសម្រាប់គំរូរង្វាស់អាស្រ័យ

1. កំណត់តម្លៃដែលបានគណនានៃ t-test ដោយប្រើរូបមន្ត

, កន្លែងណា

4. ប្រៀបធៀបតម្លៃដែលបានគណនា និងសំខាន់នៃ t-test ។

ប្រសិនបើតម្លៃដែលបានគណនាគឺធំជាង ឬស្មើនឹងតម្លៃសំខាន់ នោះសម្មតិកម្មនៃភាពស្មើគ្នានៃតម្លៃមធ្យមក្នុងគំរូពីរនៃការផ្លាស់ប្តូរត្រូវបានបដិសេធ (ប៉ុន្តែ)។ នៅក្នុងគ្រប់ករណីផ្សេងទៀត វាត្រូវបានទទួលយកនៅកម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យ។- យូលក្ខណៈវិនិច្ឆ័យ- ម៉ាណា

វីតនី

គោលបំណងនៃលក្ខណៈវិនិច្ឆ័យ< 30.

លក្ខណៈវិនិច្ឆ័យមានគោលបំណងវាយតម្លៃភាពខុសគ្នារវាងគំរូដែលមិនមែនជាប៉ារ៉ាម៉ែត្រពីរក្នុងលក្ខខណ្ឌនៃកម្រិតនៃលក្ខណៈវាស់វែងតាមបរិមាណណាមួយ។

វាអនុញ្ញាតឱ្យអ្នកកំណត់ភាពខុសគ្នារវាងគំរូតូចៗនៅពេល n

ការពិពណ៌នាអំពីលក្ខណៈវិនិច្ឆ័យ

វិធីសាស្រ្តនេះកំណត់ថាតើផ្ទៃនៃតម្លៃត្រួតស៊ីគ្នារវាងស៊េរីពីរមានទំហំតូចល្មមឬអត់។ តំបន់នេះកាន់តែតូច ភាពខុសប្លែកគ្នាកាន់តែមានសារៈសំខាន់។ តម្លៃជាក់ស្តែងនៃលក្ខណៈវិនិច្ឆ័យ U ឆ្លុះបញ្ចាំងពីទំហំនៃការព្រមព្រៀងរវាងជួរដេក។ ដូច្នេះ U តូចជាង វាទំនងជាថាភាពខុសគ្នាគឺសំខាន់។

សម្មតិកម្ម

ប៉ុន្តែ៖ កម្រិតនៃចរិតនៅក្នុងក្រុមទី 2 មិនទាបជាងកម្រិតនៃចរិតនៅក្នុងក្រុមទី 1 ទេ។

    HI៖ កម្រិតនៃលក្ខណៈនៅក្នុងក្រុមទី 2 គឺទាបជាងកម្រិតនៃលក្ខណៈនៅក្នុងក្រុមទី 1 ។

    ក្បួនដោះស្រាយសម្រាប់ការគណនាលក្ខណៈវិនិច្ឆ័យ Mann-Whitney (u)

    ផ្ទេរទិន្នន័យនៃមុខវិជ្ជាធ្វើតេស្តទាំងអស់ទៅកាតបុគ្គល។


សម្គាល់សន្លឹកបៀនៃមុខវិជ្ជាក្នុងគំរូទី 1 ជាមួយនឹងពណ៌មួយ និយាយថាពណ៌ក្រហម និងសន្លឹកបៀទាំងអស់ពីគំរូទី 2 ជាមួយនឹងពណ៌ផ្សេងទៀត ឧទាហរណ៍ពណ៌ខៀវ។

រៀបចំសន្លឹកបៀទាំងអស់ក្នុងជួរតែមួយដោយយោងទៅតាមកម្រិតនៃការកើនឡើងនៃគុណលក្ខណៈ ដោយមិនគិតពីគំរូណាមួយដែលពួកគេជាកម្មសិទ្ធិ ដូចជាប្រសិនបើយើងកំពុងធ្វើការជាមួយគំរូធំមួយ។

ដែល n 1 ជាចំនួនមុខវិជ្ជាក្នុងគំរូ 1;

n 2 - ចំនួនមុខវិជ្ជាក្នុងគំរូ 2,

T x - ធំជាងនៃចំនួន rant ទាំងពីរ;

n x - ចំនួនមុខវិជ្ជានៅក្នុងក្រុមដែលមានចំនួនច្រើននៃចំណាត់ថ្នាក់។

9. កំណត់តម្លៃសំខាន់នៃ U យោងតាមតារាងទី 2 (សូមមើលឧបសម្ព័ន្ធ) ។ ប្រសិនបើ U emp.> U cr0.05 នោះសម្មតិកម្ម ប៉ុន្តែត្រូវបានទទួលយក។

ប្រសិនបើ U emp.≤ U cr នោះវាត្រូវបានបដិសេធ។ តម្លៃ U តូចជាង ភាពជឿជាក់នៃភាពខុសគ្នាកាន់តែខ្ពស់។

ឧទាហរណ៍។

ប្រៀបធៀបប្រសិទ្ធភាពនៃវិធីសាស្រ្តបង្រៀនពីរក្រុម។ លទ្ធផលតេស្តត្រូវបានបង្ហាញក្នុងតារាងទី 5 ។

តារាងទី 5

ចូរយើងផ្ទេរទិន្នន័យទាំងអស់ទៅតារាងមួយផ្សេងទៀត ដោយបន្លិចទិន្នន័យនៃក្រុមទីពីរដោយគូសបន្ទាត់ពីក្រោម ហើយធ្វើចំណាត់ថ្នាក់នៃគំរូសរុប (សូមមើលក្បួនដោះស្រាយចំណាត់ថ្នាក់នៅក្នុងការណែនាំសម្រាប់កិច្ចការទី 3)។

តម្លៃ

ចូរស្វែងរកផលបូកនៃចំណាត់ថ្នាក់នៃគំរូពីរ ហើយជ្រើសរើសធំជាងនេះ៖ T x = 113 ចូរយើងគណនាតម្លៃជាក់ស្តែងនៃលក្ខណៈវិនិច្ឆ័យដោយប្រើរូបមន្ត 2: U p = 30 ។ប្រសិនបើតម្លៃដែលបានគណនាគឺធំជាង ឬស្មើនឹងតម្លៃសំខាន់ នោះសម្មតិកម្មនៃភាពស្មើគ្នានៃតម្លៃមធ្យមក្នុងគំរូពីរនៃការផ្លាស់ប្តូរត្រូវបានបដិសេធ (ប៉ុន្តែ)។ នៅក្នុងគ្រប់ករណីផ្សេងទៀត វាត្រូវបានទទួលយកនៅកម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យ។គឺធំជាងការរិះគន់នៅកម្រិតសារៈសំខាន់ p = 0.05 និង 30 > 19 បន្ទាប់មកសម្មតិកម្មអំពីសមភាពនៃមធ្យោបាយត្រូវបានទទួលយក ហើយភាពខុសគ្នានៃវិធីសាស្រ្តបង្រៀនគឺមិនសំខាន់.

វិធីសាស្រ្តអនុញ្ញាតឱ្យអ្នកសាកល្បងសម្មតិកម្មដែលតម្លៃមធ្យមនៃចំនួនប្រជាជនទូទៅពីរដែលតម្លៃប្រៀបធៀបត្រូវបានស្រង់ចេញ អាស្រ័យគំរូខុសគ្នាពីគ្នាទៅវិញទៅមក។ ការសន្មត់នៃការពឹងផ្អែកច្រើនតែមានន័យថាលក្ខណៈត្រូវបានវាស់នៅលើគំរូដូចគ្នាពីរដងឧទាហរណ៍ មុនពេលអន្តរាគមន៍ និងបន្ទាប់ពីវា។ ក្នុងករណីទូទៅ អ្នកតំណាងនីមួយៗនៃគំរូមួយត្រូវបានចាត់តាំងតំណាងពីគំរូមួយផ្សេងទៀត (ពួកគេត្រូវបានផ្សំជាគូ) ដើម្បីឱ្យស៊េរីទិន្នន័យទាំងពីរមានទំនាក់ទំនងវិជ្ជមានជាមួយគ្នា។ ប្រភេទខ្សោយនៃការពឹងផ្អែកគំរូ: គំរូ 1 - ប្តី, គំរូ 2 - ប្រពន្ធរបស់ពួកគេ; គំរូទី 1 - កុមារអាយុមួយឆ្នាំ គំរូទី 2 ត្រូវបានបង្កើតឡើងដោយកូនភ្លោះក្នុងគំរូទី 1 ។ល។

សម្មតិកម្មស្ថិតិដែលអាចសាកល្បងបាន,ដូចករណីមុន H 0៖ M 1 = M 2(តម្លៃជាមធ្យមនៅក្នុងគំរូទី 1 និងទី 2 គឺស្មើគ្នា) ប្រសិនបើវាត្រូវបានបដិសេធ សម្មតិកម្មជំនួសត្រូវបានទទួលយកនោះ។ ម ១ច្រើន (តិច) ម ២.

ការសន្មត់ដំបូងសម្រាប់ការធ្វើតេស្តស្ថិតិ៖

□ តំណាងនីមួយៗនៃគំរូមួយ (ពីប្រជាជនទូទៅមួយ) ត្រូវបានភ្ជាប់ជាមួយអ្នកតំណាងនៃគំរូមួយផ្សេងទៀត (ពីប្រជាជនទូទៅផ្សេងទៀត);

□ ទិន្នន័យពីគំរូពីរគឺទាក់ទងគ្នាជាវិជ្ជមាន (ទម្រង់គូ);

□ ការចែកចាយលក្ខណៈដែលកំពុងសិក្សានៅក្នុងគំរូទាំងពីរត្រូវគ្នាទៅនឹងច្បាប់ធម្មតា។

រចនាសម្ព័ន្ធទិន្នន័យប្រភព៖មានតម្លៃពីរនៃលក្ខណៈពិសេសដែលបានសិក្សាសម្រាប់វត្ថុនីមួយៗ (សម្រាប់គូនីមួយៗ)។

ការរឹតបន្តឹង៖ការចែកចាយលក្ខណៈនៅក្នុងគំរូទាំងពីរមិនគួរខុសគ្នាខ្លាំងពីធម្មតាទេ។ ទិន្នន័យនៃការវាស់វែងទាំងពីរដែលត្រូវគ្នានឹងគំរូទាំងពីរគឺទាក់ទងគ្នាជាវិជ្ជមាន។

ជម្មើសជំនួស៖ការធ្វើតេស្ត Wilcoxon T ប្រសិនបើការចែកចាយយ៉ាងហោចណាស់គំរូមួយខុសគ្នាយ៉ាងខ្លាំងពីធម្មតា; t-ការធ្វើតេស្តសិស្សសម្រាប់គំរូឯករាជ្យ - ប្រសិនបើទិន្នន័យសម្រាប់សំណាកទាំងពីរមិនជាប់ទាក់ទងគ្នាជាវិជ្ជមាន។

រូបមន្តសម្រាប់តម្លៃជាក់ស្តែងនៃការធ្វើតេស្តរបស់សិស្ស t ឆ្លុះបញ្ចាំងពីការពិតដែលថាឯកតានៃការវិភាគសម្រាប់ភាពខុសគ្នាគឺ ភាពខុសគ្នា (ការផ្លាស់ប្តូរ)តម្លៃលក្ខណៈសម្រាប់គូនៃការសង្កេតនីមួយៗ។ ដូច្នោះហើយ សម្រាប់គូ N នីមួយៗនៃតម្លៃគុណលក្ខណៈ ភាពខុសគ្នាត្រូវបានគណនាដំបូង d i = x 1 i − x 2 i ។

(3) ដែល M d - ភាពខុសគ្នាជាមធ្យមនៃតម្លៃ; σ d - គម្លាតស្តង់ដារនៃភាពខុសគ្នា។

ឧទាហរណ៍នៃការគណនា៖

ចូរសន្មតថាក្នុងអំឡុងពេលសាកល្បងប្រសិទ្ធភាពនៃវគ្គបណ្តុះបណ្តាល សមាជិកក្រុមនីមួយៗក្នុងចំណោម 8 នាក់ត្រូវបានសួរសំណួរថា "តើមតិរបស់អ្នកស្របគ្នានឹងមតិរបស់ក្រុមញឹកញាប់ប៉ុណ្ណា?" - ពីរដងមុន និងក្រោយការបណ្តុះបណ្តាល។ មាត្រដ្ឋាន 10 ចំណុចត្រូវបានប្រើសម្រាប់ការឆ្លើយតប: 1 - មិនដែល, 5 - ពាក់កណ្តាលពេលវេលា, 10 - ជានិច្ច។ សម្មតិកម្មត្រូវបានសាកល្បងថា ជាលទ្ធផលនៃការបណ្តុះបណ្តាល ការជឿជាក់លើខ្លួនឯងនៃការអនុលោម (បំណងប្រាថ្នាចង់ធ្វើដូចអ្នកដទៃក្នុងក្រុម) នៃអ្នកចូលរួមនឹងកើនឡើង (α = 0.05) ។ ចូរយើងបង្កើតតារាងសម្រាប់ការគណនាកម្រិតមធ្យម (តារាងទី 3)។

តារាងទី 3

មធ្យមនព្វន្ធសម្រាប់ភាពខុសគ្នា M d = (-6)/8= -0.75 ។ ដកតម្លៃនេះចេញពី d នីមួយៗ (ជួរចុងក្រោយនៃតារាង)។

រូបមន្តសម្រាប់គម្លាតស្តង់ដារខុសគ្នាតែនៅក្នុង d ដែលបង្ហាញនៅក្នុងវាជំនួសឱ្យ X ។ យើងជំនួសតម្លៃចាំបាច់ទាំងអស់ ហើយយើងទទួលបាន

σ d = = 0.886 ។

ជំហានទី 1. គណនាតម្លៃជាក់ស្តែងនៃលក្ខណៈវិនិច្ឆ័យដោយប្រើរូបមន្ត (3): ភាពខុសគ្នាជាមធ្យម Md= -0.75; គម្លាតស្តង់ដារ σ d = 0,886; t អ៊ី = 2,39; df = 7.

ជំហានទី 2. ដោយប្រើតារាងតម្លៃសំខាន់នៃ t-Student criterion យើងកំណត់ p-level នៃសារៈសំខាន់។ សម្រាប់ df = 7 តម្លៃជាក់ស្តែងគឺនៅចន្លោះតម្លៃសំខាន់សម្រាប់ p = 0.05 និង p - 0.01 ។ ដូច្នេះ ទំ< 0,05.

df
0,05 0,01 0,001
2,365 3,499 5,408

ជំហានទី 3. យើងធ្វើការសម្រេចចិត្តស្ថិតិ និងបង្កើតការសន្និដ្ឋាន។ សម្មតិកម្មស្ថិតិនៃសមភាពនៃមធ្យោបាយត្រូវបានច្រានចោល។ សេចក្តីសន្និដ្ឋាន៖ ការវាយតម្លៃដោយខ្លួនឯងនៃការអនុលោមតាមលក្ខណៈរបស់អ្នកចូលរួមបន្ទាប់ពីការបណ្តុះបណ្តាលបានកើនឡើងគួរឱ្យកត់សម្គាល់ (នៅកម្រិតសារៈសំខាន់ ទំ< 0,05).

វិធីសាស្រ្តប៉ារ៉ាម៉ែត្ររួមមាន ការប្រៀបធៀបភាពខុសគ្នានៃគំរូពីរយោងទៅតាមលក្ខណៈវិនិច្ឆ័យ F-Fisher ។ពេលខ្លះវិធីសាស្រ្តនេះនាំទៅរកការសន្និដ្ឋានដ៏មានអត្ថន័យដ៏មានតម្លៃ ហើយក្នុងករណីនៃការប្រៀបធៀបមធ្យោបាយសម្រាប់គំរូឯករាជ្យ ការប្រៀបធៀបភាពខុសប្លែកគ្នាគឺ កាតព្វកិច្ចនីតិវិធី។

ដើម្បីគណនា អេមអ្នកត្រូវស្វែងរកសមាមាត្រនៃបំរែបំរួលនៃគំរូទាំងពីរ ហើយដូច្នេះ វ៉ារ្យ៉ង់ធំជាងគឺនៅក្នុងភាគយក ហើយមួយតូចជាងគឺនៅក្នុងភាគបែង។

ការប្រៀបធៀបភាពខុសគ្នា. វិធីសាស្រ្តអនុញ្ញាតឱ្យអ្នកសាកល្បងសម្មតិកម្មថាភាពខុសគ្នានៃចំនួនប្រជាជនទាំងពីរដែលគំរូប្រៀបធៀបត្រូវបានទាញខុសគ្នាពីគ្នាទៅវិញទៅមក។ សម្មតិកម្មស្ថិតិដែលបានសាកល្បង H 0: σ 1 2 = σ 2 2 (វ៉ារ្យង់ក្នុងគំរូទី 1 គឺស្មើនឹងបំរែបំរួលក្នុងគំរូទី 2) ។ ប្រសិនបើវាត្រូវបានច្រានចោល សម្មតិកម្មជំនួសត្រូវបានទទួលយកថាភាពខុសគ្នាមួយគឺធំជាងផ្សេងទៀត។

ការសន្មត់ដំបូង៖ សំណាកពីរត្រូវបានទាញដោយចៃដន្យពីចំនួនប្រជាជនផ្សេងៗគ្នាជាមួយនឹងការចែកចាយធម្មតានៃលក្ខណៈដែលកំពុងសិក្សា។

រចនាសម្ព័ន្ធទិន្នន័យប្រភព៖លក្ខណៈដែលកំពុងសិក្សាត្រូវបានវាស់វែងក្នុងវត្ថុ (មុខវិជ្ជា) ដែលនីមួយៗជាកម្មសិទ្ធិរបស់គំរូមួយក្នុងចំណោមគំរូទាំងពីរដែលកំពុងត្រូវបានប្រៀបធៀប។

ការរឹតបន្តឹង៖ការចែកចាយលក្ខណៈនៅក្នុងគំរូទាំងពីរមិនខុសគ្នាខ្លាំងពីធម្មតាទេ។

វិធីសាស្រ្តជំនួស៖ការធ្វើតេស្តរបស់ Levene ការប្រើប្រាស់ដែលមិនតម្រូវឱ្យមានការត្រួតពិនិត្យការសន្មត់នៃភាពធម្មតា (ប្រើក្នុងកម្មវិធី SPSS) ។

រូបមន្តសម្រាប់តម្លៃជាក់ស្តែងនៃការធ្វើតេស្ត Fisher's F៖

(4)

ដែលជាកន្លែងដែល σ 1 2 - ការបែកខ្ចាត់ខ្ចាយធំ និង σ 2 2 - ការបែកខ្ចាត់ខ្ចាយតូចជាង។ ដោយសារវាមិនត្រូវបានគេដឹងជាមុនថាតើការបែកខ្ចាត់ខ្ចាយមួយណាធំជាងនោះដើម្បីកំណត់កម្រិត p វាត្រូវបានប្រើ តារាងតម្លៃសំខាន់សម្រាប់ជម្រើសដែលមិនមានទិសដៅ។ប្រសិនបើ F e > F Kpសម្រាប់ចំនួនដែលត្រូវគ្នានៃដឺក្រេនៃសេរីភាព r < 0,05 и статистическую гипотезу о равенстве дисперсий можно отклонить (для α = 0,05).

ឧទាហរណ៍នៃការគណនា៖

កុមារត្រូវបានផ្តល់បញ្ហានព្វន្ធជាទៀងទាត់ បន្ទាប់ពីនោះសិស្សពាក់កណ្តាលដែលបានជ្រើសរើសដោយចៃដន្យត្រូវបានគេប្រាប់ថាពួកគេបានបរាជ័យក្នុងការប្រលង ហើយនៅសល់ត្រូវបានប្រាប់ផ្ទុយពីនេះ។ បន្ទាប់មក កុមារម្នាក់ៗត្រូវបានគេសួរថាតើវាត្រូវចំណាយពេលប៉ុន្មានវិនាទីដើម្បីដោះស្រាយបញ្ហាស្រដៀងគ្នានេះ។ អ្នកពិសោធន៍បានគណនាភាពខុសគ្នារវាងពេលវេលាដែលកុមារហៅ និងលទ្ធផលនៃកិច្ចការដែលបានបញ្ចប់ (គិតជាវិនាទី)។ វាត្រូវបានគេរំពឹងថាសារនៃការបរាជ័យនឹងបណ្តាលឱ្យមានភាពមិនគ្រប់គ្រាន់មួយចំនួននៅក្នុងការគោរពខ្លួនឯងរបស់កុមារ។ សម្មតិកម្មដែលកំពុងត្រូវបានសាកល្បង (នៅកម្រិត α = 0.005) គឺថា ភាពខុសគ្នានៃការគោរពខ្លួនឯងសរុបមិនអាស្រ័យលើរបាយការណ៍ជោគជ័យ ឬបរាជ័យ (H 0: σ 1 2 = σ 2 2) ។

ទិន្នន័យខាងក្រោមត្រូវបានទទួល៖


ជំហានទី 1. គណនាតម្លៃជាក់ស្តែងនៃលក្ខណៈវិនិច្ឆ័យ និងចំនួនដឺក្រេនៃសេរីភាពដោយប្រើរូបមន្ត (4):

ជំហានទី 2. យោងតាមតារាងតម្លៃសំខាន់នៃ Fisher f-criterion for មិនបានដឹកនាំជម្មើសជំនួសដែលយើងរកឃើញតម្លៃសំខាន់សម្រាប់ លេខ df = 11; df ដឹង= 11. ទោះយ៉ាងណាក៏ដោយ មានតម្លៃសំខាន់សម្រាប់តែ លេខ df= 10 និង df ដឹង = 12. វាមិនអាចទៅរួចទេក្នុងការទទួលយកចំនួនដឺក្រេនៃសេរីភាពកាន់តែច្រើន ដូច្នេះយើងយកតម្លៃសំខាន់សម្រាប់ លេខ df= 10: សម្រាប់ r = 0,05 F Kp =៣.៥២៦; សម្រាប់ r = 0,01 F Kp = 5,418.

ជំហានទី 3. ធ្វើការសម្រេចចិត្តតាមស្ថិតិ និងការសន្និដ្ឋានប្រកបដោយអត្ថន័យ។ ចាប់តាំងពីតម្លៃជាក់ស្តែងលើសពីតម្លៃសំខាន់សម្រាប់ r= 0.01 (និងសូម្បីតែច្រើនទៀតដូច្នេះសម្រាប់ p = 0.05) បន្ទាប់មកក្នុងករណីនេះទំ< 0,01 и принимается альтернативная гипо­теза: дисперсия в группе 1 превышает дисперсию в группе 2 (ទំ< 0.01) ។ ហេតុដូច្នេះហើយ បន្ទាប់ពីសារអំពីការបរាជ័យ ភាពមិនគ្រប់គ្រាន់នៃការគោរពខ្លួនឯងគឺខ្ពស់ជាងបន្ទាប់ពីសារអំពីភាពជោគជ័យ។

/ ស្ថិតិជាក់ស្តែង / ឯកសារយោង / តម្លៃតេស្តរបស់សិស្ស

អត្ថន័យt - ការធ្វើតេស្តរបស់សិស្សនៅកម្រិតសារៈសំខាន់ 0.10, 0.05 និង 0.01

ν - កម្រិតនៃសេរីភាពនៃការផ្លាស់ប្តូរ

តម្លៃតេស្ត t របស់សិស្សស្តង់ដារ

ចំនួនដឺក្រេនៃសេរីភាព

កម្រិតសារៈសំខាន់

ចំនួនដឺក្រេនៃសេរីភាព

កម្រិតសារៈសំខាន់

តុ XI

តម្លៃតេស្តស្តង់ដារ Fisher ប្រើដើម្បីវាយតម្លៃពីសារៈសំខាន់នៃភាពខុសគ្នារវាងគំរូពីរ

កម្រិតនៃសេរីភាព

កម្រិតសារៈសំខាន់

កម្រិតនៃសេរីភាព

កម្រិតសារៈសំខាន់

តេស្ត T-test របស់សិស្ស

តេស្ត T-test របស់សិស្ស- ឈ្មោះទូទៅសម្រាប់ថ្នាក់នៃវិធីសាស្រ្តសម្រាប់ការធ្វើតេស្តស្ថិតិនៃសម្មតិកម្ម (ការធ្វើតេស្តស្ថិតិ) ដោយផ្អែកលើការចែកចាយសិស្ស។ ការប្រើប្រាស់ទូទៅបំផុតនៃការធ្វើតេស្ត t ពាក់ព័ន្ធនឹងការធ្វើតេស្តសមភាពនៃមធ្យោបាយនៅក្នុងគំរូពីរ។

t-ស្ថិតិជាធម្មតាត្រូវបានសាងសង់តាមគោលការណ៍ទូទៅដូចខាងក្រោមៈ ភាគយកគឺជាអថេរចៃដន្យជាមួយនឹងការរំពឹងទុកគណិតវិទ្យាសូន្យ (ប្រសិនបើសម្មតិកម្មមិនពេញចិត្ត) ហើយភាគបែងគឺជាគម្លាតគំរូគំរូនៃអថេរចៃដន្យនេះ ទទួលបានជាឫសការ៉េនៃ ការប៉ាន់ប្រមាណភាពខុសគ្នាដែលមិនលាយបញ្ចូលគ្នា។

រឿង

លក្ខណៈវិនិច្ឆ័យនេះត្រូវបានបង្កើតឡើងដោយលោក William Gossett ដើម្បីវាយតម្លៃគុណភាពនៃស្រាបៀរនៅឯក្រុមហ៊ុន Guinness ។ ទាក់ទងនឹងកាតព្វកិច្ចចំពោះក្រុមហ៊ុនទាក់ទងនឹងការមិនបង្ហាញអាថ៌កំបាំងពាណិជ្ជកម្ម (ការគ្រប់គ្រងហ្គីណេសបានចាត់ទុកថាការប្រើប្រាស់ឧបករណ៍ស្ថិតិនៅក្នុងការងាររបស់ខ្លួន) អត្ថបទរបស់ Gosset ត្រូវបានបោះពុម្ពនៅឆ្នាំ 1908 នៅក្នុងទិនានុប្បវត្តិ Biometrics ក្រោមឈ្មោះក្លែងក្លាយ "សិស្ស" ។

តម្រូវការទិន្នន័យ

ដើម្បីអនុវត្តលក្ខណៈវិនិច្ឆ័យនេះ វាចាំបាច់ដែលទិន្នន័យដើមមានការចែកចាយធម្មតា។ នៅក្នុងករណីនៃការអនុវត្តការធ្វើតេស្តគំរូពីរសម្រាប់គំរូឯករាជ្យ វាក៏ចាំបាច់ផងដែរក្នុងការអនុលោមតាមលក្ខខណ្ឌនៃភាពស្មើគ្នានៃការប្រែប្រួល។ ទោះយ៉ាងណាក៏ដោយ មានជម្រើសជំនួសសម្រាប់ការធ្វើតេស្តរបស់សិស្សសម្រាប់ស្ថានភាពដែលមានការប្រែប្រួលមិនស្មើគ្នា។

តម្រូវការនៃការចែកចាយទិន្នន័យធម្មតាគឺចាំបាច់សម្រាប់ភាពត្រឹមត្រូវ t (\displaystyle t) -test ។ ទោះយ៉ាងណាក៏ដោយ ទោះបីជាមានការចែកចាយទិន្នន័យផ្សេងទៀតក៏ដោយ វាអាចប្រើ t (\displaystyle t) -statistics ។ ក្នុងករណីជាច្រើន ស្ថិតិនេះមានលក្ខណៈ asymptotically មានការចែកចាយធម្មតាស្តង់ដារ - N (0, 1) (\displaystyle N(0,1)) ដូច្នេះបរិមាណនៃការចែកចាយនេះអាចត្រូវបានប្រើ។ ទោះយ៉ាងណាក៏ដោយ ទោះបីជាក្នុងករណីនេះ quantile ជាញឹកញាប់ត្រូវបានគេប្រើមិនមែនជាការចែកចាយធម្មតាស្តង់ដារ ប៉ុន្តែនៃការចែកចាយសិស្សដែលត្រូវគ្នា ដូចនៅក្នុងការធ្វើតេស្តពិតប្រាកដ t (\displaystyle t) ។ ពួកវាគឺសមមូល asymptotically ប៉ុន្តែនៅក្នុងគំរូតូចៗ ចន្លោះពេលទំនុកចិត្តនៃការចែកចាយសិស្សគឺកាន់តែទូលំទូលាយ និងអាចទុកចិត្តបានជាង។

ការធ្វើតេស្ត T-គំរូតែមួយ

ប្រើដើម្បីសាកល្បងសម្មតិកម្មគ្មានន័យ H 0: E (X) = m (\displaystyle H_(0):E(X)=m) អំពីសមភាពនៃការរំពឹងទុកគណិតវិទ្យា E (X) (\displaystyle E(X)) ទៅ តម្លៃដែលគេស្គាល់ខ្លះ m (\displaystyle m) ។

ជាក់ស្តែង ប្រសិនបើសម្មតិកម្មទទេគឺពេញចិត្ត E (X ¯) = m (\displaystyle E((\overline (X)))=m) ។ ដោយគិតគូរពីឯករាជ្យភាពនៃការសង្កេត V (X ¯) = σ 2 / n (\displaystyle V((\overline (X)))=\sigma ^(2)/n) ។ ដោយប្រើការប៉ាន់ប្រមាណការប្រែប្រួលដែលមិនលំអៀង s X 2 = ∑ t = 1 n (X t − X ¯) 2 / (n − 1) (\displaystyle s_(X)^(2)=\sum _(t=1)^( n )(X_(t)-(\overline (X)))^(2)/(n-1)) យើងទទួលបានស្ថិតិ t ខាងក្រោម៖

t = X ¯ − m s X / n (\displaystyle t=(\frac ((\overline (X))-m)(s_(X)/(\sqrt (n)))))

នៅក្រោមសម្មតិកម្មគ្មានន័យ ការចែកចាយនៃស្ថិតិនេះគឺ t (n − 1) (\displaystyle t(n-1)) ។ ដូច្នេះហើយ ប្រសិនបើតម្លៃដាច់ខាតនៃស្ថិតិលើសពីតម្លៃសំខាន់នៃការចែកចាយដែលបានផ្តល់ឱ្យ (នៅកម្រិតសារៈសំខាន់ដែលបានផ្តល់ឱ្យ) សម្មតិកម្មគ្មានន័យត្រូវបានច្រានចោល។

ការធ្វើតេស្ត t-គំរូពីរសម្រាប់គំរូឯករាជ្យ

សូមឱ្យមានគំរូឯករាជ្យពីរនៃបរិមាណ n 1, n 2 (\displaystyle n_(1)~,~n_(2)) នៃអថេរចៃដន្យចែកចាយធម្មតា X 1, X 2 (\displaystyle X_(1),~X_(2 )) វាចាំបាច់ក្នុងការសាកល្បងសម្មតិកម្មគ្មានន័យនៃសមភាពនៃការរំពឹងទុកគណិតវិទ្យានៃអថេរចៃដន្យទាំងនេះ H 0: M 1 = M 2 (\displaystyle H_(0):~M_(1)=M_(2)) ដោយប្រើទិន្នន័យគំរូ។

ពិចារណាពីភាពខុសគ្នារវាងមធ្យោបាយគំរូ Δ = X ¯ 1 − X ¯ 2 (\displaystyle \Delta =(\overline (X))_(1)-(\overline (X))_(2)) ។ ជាក់ស្តែង ប្រសិនបើសម្មតិកម្មទទេគឺពិត E (Δ) = M 1 − M 2 = 0 (\displaystyle E(\Delta)=M_(1)-M_(2)=0) ។ ភាពខុសគ្នានៃភាពខុសគ្នានេះគឺស្មើគ្នា ដោយផ្អែកលើឯករាជ្យនៃគំរូ៖ V (Δ) = σ 1 2 n 1 + σ 2 2 n 2 (\displaystyle V(\Delta)=(\frac (\sigma _(1) )^(2))(n_(1)))+(\frac (\sigma _(2)^(2))(n_(2)))))។ បន្ទាប់មកដោយប្រើការប៉ាន់ប្រមាណភាពប្រែប្រួលដែលមិនលំអៀង s 2 = ∑ t = 1 n (X t − X ¯) 2 n − 1 (\displaystyle s^(2)=(\frac (\sum _(t=1)^(n)) ( X_(t)-(\overline (X)))^(2))(n-1))) យើងទទួលបានការប៉ាន់ស្មានដោយមិនលំអៀងនៃភាពខុសគ្នានៃភាពខុសគ្នារវាងមធ្យោបាយគំរូ៖ s Δ 2 = s 1 2 n 1 + s 2 2 n 2 (\ displaystyle s_(\Delta )^(2)=(\frac (s_(1)^(2))(n_(1)))+(\frac (s_(2)^( ២))(n_(២))))។ ដូច្នេះ t-statistic សម្រាប់សាកល្បងសម្មតិកម្ម null គឺ

T = X ¯ 1 − X ¯ 2 s 1 2 n 1 + s 2 2 n 2 (\displaystyle t=(\frac ((\overline (X)))_(1)-(\overline (X))_( 2))(\sqrt ((\frac (s_(1)^(2)))(n_(1))))+(\frac (s_(2)^(2))(n_(2)))))) ))

ប្រសិនបើសម្មតិកម្មទទេគឺជាការពិត ស្ថិតិនេះមានការចែកចាយ t (d f) (\displaystyle t(df)) ដែល d f = (s 1 2 / n 1 + s 2 2 / n 2) 2 (s 1 2 / n 1) 2 / (n 1 − 1) + (s 2 2 / n 2) 2 / (n 2 − 1) (\displaystyle df=(\frac ((s_(1)^(2)/n_(1)) +s_(2)^(2)/n_(2))^(2))((s_(1)^(2)/n_(1))^(2)/(n_(1)-1)+ (s_(2)^(2)/n_(2))^(2)/(n_(2)-1))))

ករណីនៃភាពប្រែប្រួលស្មើគ្នា

ប្រសិនបើភាពខុសគ្នានៃគំរូត្រូវបានសន្មត់ថាស្មើគ្នា

V (Δ) = σ 2 (1 n 1 + 1 n 2) (\displaystyle V(\Delta)=\sigma ^(2)\left((\frac (1)(n_(1)))+(\ frac (1)(n_(2))))\right))

បន្ទាប់មកស្ថិតិ t គឺ៖

T = X ¯ 1 − X ¯ 2 s X 1 n 1 + 1 n 2 , s X = (n 1 − 1) s 1 2 + (n 2 − 1) s 2 2 n 1 + n 2 − 2 (\ ទម្រង់បង្ហាញ t=(\frac ((\overline (X))_(1)-(\overline (X))_(2))(s_(X)(\sqrt ((\frac (1))(n_(1) )))+(\frac (1)(n_(2)))))))~,~~s_(X)=(\sqrt (\frac ((n_(1)-1)s_(1))^ ( 2)+(n_(2)-1)s_(2)^(2))(n_(1)+n_(2)-2)))))

ស្ថិតិនេះមានការចែកចាយ t (n 1 + n 2 − 2) (\displaystyle t(n_(1)+n_(2)-2))

ការធ្វើតេស្ត t-គំរូពីរសម្រាប់សំណាកដែលពឹងផ្អែក

ដើម្បីគណនាតម្លៃជាក់ស្តែងនៃ t (\displaystyle t) -criterion ក្នុងស្ថានភាពនៃការធ្វើតេស្តសម្មតិកម្មអំពីភាពខុសគ្នារវាងសំណាកដែលពឹងផ្អែកពីរ (ឧទាហរណ៍គំរូពីរនៃការធ្វើតេស្តដូចគ្នាជាមួយនឹងចន្លោះពេល) រូបមន្តខាងក្រោមត្រូវបានប្រើ៖

T = M d s d / n (\displaystyle t=(\frac (M_(d))(s_(d)/(\sqrt (n))))))

ដែល M d (\displaystyle M_(d)) គឺជាភាពខុសគ្នាជាមធ្យមនៃតម្លៃ s d (\displaystyle s_(d)) គឺជាគម្លាតស្តង់ដារនៃភាពខុសគ្នា ហើយ n គឺជាចំនួននៃការសង្កេត

ស្ថិតិនេះមានការចែកចាយ t (n − 1) (\displaystyle t(n-1)) ។

ការធ្វើតេស្តកម្រិតលីនេអ៊ែរលើប៉ារ៉ាម៉ែត្រតំរែតំរង់លីនេអ៊ែរ

ការធ្វើតេស្ត t ក៏អាចសាកល្បងដែនកំណត់លីនេអ៊ែរតាមអំពើចិត្ត (តែមួយ) លើប៉ារ៉ាម៉ែត្រនៃតំរែតំរង់លីនេអ៊ែរដែលប៉ាន់ស្មានដោយការ៉េតិចបំផុត។ អនុញ្ញាតឱ្យវាចាំបាច់ដើម្បីសាកល្បងសម្មតិកម្ម H 0: c T b = a (\displaystyle H_(0):c^(T)b=a) ។ ជាក់ស្តែង ប្រសិនបើសម្មតិកម្មទទេត្រូវបានពេញចិត្ត E (c T b ^ − a) = c T E (b ^) − a = 0 (\displaystyle E(c^(T)(\hat (b))-a)= c^(T)E((\hat (b)))-a=0) ។ នៅទីនេះយើងប្រើទ្រព្យសម្បត្តិនៃការប៉ាន់ស្មានការេយ៉ាងហោចណាស់ដែលមិនលំអៀងនៃប៉ារ៉ាម៉ែត្រគំរូ E (b ^) = b (\displaystyle E((\hat (b)))=b) ។ លើសពីនេះទៀត V (c T b ^ − a) = c T V (b ^) c = σ 2 c T (X T X) − 1 c (\displaystyle V(c^(T)(\hat (b))-a )=c^(T)V((\hat (b)))c=\sigma ^(2)c^(T)(X^(T)X)^(-1)c) ។ ដោយប្រើជំនួសការបំរែបំរួលដែលមិនស្គាល់ ការប៉ាន់ប្រមាណដែលមិនលំអៀងរបស់វា s 2 = E S S / (n − k) (\displaystyle s^(2)=ESS/(n-k)) យើងទទួលបានស្ថិតិ t ខាងក្រោម៖

T = c T b ^ − a s c T (X T X) − 1 c (\displaystyle t=(\frac (c^(T)(\hat (b))-a)(s(\sqrt (c^(T))) (X^(T)X)^(-1)c)))))

ស្ថិតិនេះនៅពេលដែលសម្មតិកម្មទទេត្រូវបានពេញចិត្ត មានការចែកចាយ t (n − k) (\displaystyle t(n-k)) ដូច្នេះប្រសិនបើតម្លៃស្ថិតិខ្ពស់ជាងតម្លៃសំខាន់ នោះសម្មតិកម្មទទេនៃកម្រិតលីនេអ៊ែរត្រូវបានច្រានចោល។ .

សាកល្បងសម្មតិកម្មអំពីមេគុណតំរែតំរង់លីនេអ៊ែរ

ករណីពិសេសនៃកម្រិតលីនេអ៊ែរកំពុងសាកល្បងសម្មតិកម្មថាមេគុណតំរែតំរង់ b j (\displaystyle b_(j)) គឺស្មើនឹងតម្លៃជាក់លាក់មួយ a (\displaystyle a) ។ ក្នុងករណីនេះ t-statistic ដែលត្រូវគ្នាគឺ៖

T = b ^ j − a s b ^ j (\displaystyle t=(\frac ((\hat (b))_(j)-a)(s_(((\hat (b))_(j)))))

ដែល s b ^ j (\displaystyle s_((\hat (b))_(j))) គឺជាកំហុសស្តង់ដារនៃការប៉ាន់ប្រមាណមេគុណ - ឫសការ៉េនៃធាតុអង្កត់ទ្រូងដែលត្រូវគ្នានៃម៉ាទ្រីសនៃសមាមាត្រនៃការប៉ាន់ប្រមាណមេគុណ។

ប្រសិនបើសម្មតិកម្មទទេគឺជាការពិត ការចែកចាយនៃស្ថិតិនេះគឺ t (n − k) (\displaystyle t(n-k)) ។ ប្រសិនបើតម្លៃដាច់ខាតនៃស្ថិតិគឺខ្ពស់ជាងតម្លៃសំខាន់ នោះភាពខុសគ្នារវាងមេគុណ និង a (\displaystyle a) គឺសំខាន់ស្ថិតិ (មិនចៃដន្យ) បើមិនដូច្នេះទេវាមិនសំខាន់ទេ (ចៃដន្យ នោះគឺមេគុណពិតគឺ ប្រហែល​ជា​ស្មើ ឬ​ជិត​ខ្លាំង​នឹង​តម្លៃ​ប៉ាន់ស្មាន​នៃ a (\ display style a))

មតិយោបល់

ការធ្វើតេស្តគំរូមួយសម្រាប់ការរំពឹងទុកគណិតវិទ្យាអាចត្រូវបានកាត់បន្ថយទៅនឹងការធ្វើតេស្តកម្រិតលីនេអ៊ែរលើប៉ារ៉ាម៉ែត្រនៃតំរែតំរង់លីនេអ៊ែរ។ នៅក្នុងការធ្វើតេស្តគំរូមួយ នេះគឺជា "តំរែតំរង់" នៅលើថេរមួយ។ ដូច្នេះ s 2 (\displaystyle s^(2)) នៃការតំរែតំរង់គឺជាការប៉ាន់ប្រមាណគំរូនៃការប្រែប្រួលនៃអថេរចៃដន្យដែលកំពុងសិក្សា ម៉ាទ្រីស X T X (\displaystyle X^(T)X) គឺស្មើនឹង n (\displaystyle n ) ហើយការប៉ាន់ប្រមាណនៃ "មេគុណ" នៃគំរូគឺស្មើនឹងមធ្យមគំរូ។ ពីទីនេះយើងទទួលបានកន្សោមសម្រាប់ t-statistic ដែលបានផ្តល់ឱ្យខាងលើសម្រាប់ករណីទូទៅ។

ស្រដៀងគ្នានេះដែរ វាអាចត្រូវបានបង្ហាញថាការធ្វើតេស្តគំរូពីរដែលមានភាពខុសគ្នានៃគំរូស្មើគ្នាក៏កាត់បន្ថយការសាកល្បងកម្រិតលីនេអ៊ែរផងដែរ។ នៅក្នុងការធ្វើតេស្តគំរូពីរ នេះគឺជា "តំរែតំរង់" លើអថេរមួយ និងអត់ចេះសោះ ដែលកំណត់អត្តសញ្ញាណគំរូរងអាស្រ័យលើតម្លៃ (0 ឬ 1): y = a + b D (\displaystyle y=a+bD) ។ សម្មតិកម្មអំពីសមភាពនៃការរំពឹងទុកគណិតវិទ្យានៃគំរូអាចត្រូវបានបង្កើតជាសម្មតិកម្មអំពីសមភាពនៃមេគុណ b នៃគំរូនេះទៅសូន្យ។ វាអាចត្រូវបានបង្ហាញថា t-statistic សមរម្យសម្រាប់ការធ្វើតេស្តសម្មតិកម្មនេះគឺស្មើនឹង t-statistic ដែលបានផ្តល់ឱ្យសម្រាប់ការធ្វើតេស្តគំរូពីរ។

វាក៏អាចត្រូវបានកាត់បន្ថយទៅនឹងការត្រួតពិនិត្យកម្រិតលីនេអ៊ែរក្នុងករណីមានការបែកខ្ញែកខុសៗគ្នា។ ក្នុង​ករណី​នេះ ភាព​ខុស​គ្នា​នៃ​គំរូ​ត្រូវ​យក​តម្លៃ​ពីរ។ ពីនេះអ្នកក៏អាចទទួលបាន t-statistic ដែលស្រដៀងនឹងអ្វីដែលផ្តល់ឱ្យសម្រាប់ការធ្វើតេស្តគំរូពីរ។

អាណាឡូកដែលមិនមែនជាប៉ារ៉ាម៉ែត្រ

analogue នៃការធ្វើតេស្តគំរូពីរសម្រាប់គំរូឯករាជ្យគឺការធ្វើតេស្ត Mann-Whitney U ។ សម្រាប់ស្ថានភាពដែលមានសំណាកពឹងផ្អែក analogues គឺជាការធ្វើតេស្តសញ្ញា និង Wilcoxon T-test

អក្សរសិល្ប៍

សិស្ស។កំហុសដែលអាចកើតមាននៃមធ្យម។ // ជីវមាត្រ។ 1908. លេខ 6 (1) ។ ទំ.១-២៥។

តំណភ្ជាប់

នៅលើលក្ខណៈវិនិច្ឆ័យសម្រាប់ការធ្វើតេស្តសម្មតិកម្មអំពីភាពដូចគ្នានៃមធ្យោបាយនៅលើគេហទំព័រនៃសាកលវិទ្យាល័យបច្ចេកទេសរដ្ឋ Novosibirsk