తిరోగమన సమీకరణ గణాంకం. లీనియర్ రిగ్రెషన్ సమీకరణం యొక్క పారామితులను కనుగొని, రిగ్రెషన్ కోఎఫీషియంట్ యొక్క ఆర్థిక వివరణను ఇవ్వండి
x -ని ప్రిడిక్టర్ అంటారు - స్వతంత్ర లేదా వివరణాత్మక వేరియబుల్.
ఇచ్చిన పరిమాణం x కోసం, Y అనేది అంచనా రేఖపై ఉండే y వేరియబుల్ (డిపెండెంట్, అవుట్పుట్ లేదా రెస్పాన్స్ వేరియబుల్ అని పిలుస్తారు) విలువ. ఇది మనకు x విలువ తెలిస్తే (సగటున) y కోసం మనం ఆశించే విలువ, మరియు దీనిని "y యొక్క అంచనా విలువ" అంటారు (మూర్తి 5).
a - మూల్యాంకన రేఖ యొక్క ఉచిత సభ్యుడు (క్రాసింగ్); x = 0 అయినప్పుడు Y విలువ.
b అనేది అంచనా వేసిన రేఖ యొక్క వాలు లేదా ప్రవణత; ఇది మనం xని ఒక యూనిట్తో పెంచితే సగటున Y పెరిగే మొత్తాన్ని సూచిస్తుంది (మూర్తి 5). గుణకం bని రిగ్రెషన్ కోఎఫీషియంట్ అంటారు.
ఉదాహరణకు: మానవ శరీర ఉష్ణోగ్రతలో 1 ° C పెరుగుదలతో, పల్స్ రేటు నిమిషానికి సగటున 10 బీట్స్ పెరుగుతుంది.
మూర్తి 5. కోఎఫీషియంట్ చూపుతున్న లీనియర్ రిగ్రెషన్ లైన్ aమరియు వాలు బి(విలువను పెంచండి వైపెరుగుతున్న తో Xయూనిట్కు)
గణితశాస్త్రపరంగా, లీనియర్ రిగ్రెషన్ సమీకరణం యొక్క పరిష్కారం a మరియు b పారామితులను లెక్కించడానికి తగ్గించబడుతుంది, తద్వారా సహసంబంధ క్షేత్రం యొక్క ప్రారంభ డేటా యొక్క పాయింట్లు ప్రత్యక్ష తిరోగమనానికి వీలైనంత దగ్గరగా .
"రిగ్రెషన్" అనే పదం యొక్క గణాంక ఉపయోగం ఫ్రాన్సిస్ గాల్టన్ (1889)కి ఆపాదించబడిన రిగ్రెషన్ టు ది మీన్ అని పిలువబడే ఒక దృగ్విషయం నుండి వచ్చింది. పొడవాటి తండ్రులు పొడవాటి కొడుకులను కలిగి ఉంటారు, అయితే కొడుకుల సగటు ఎత్తు వారి పొడవైన తండ్రుల కంటే తక్కువగా ఉంటుందని అతను చూపించాడు. కుమారుల సగటు ఎత్తు జనాభాలోని తండ్రులందరి సగటు ఎత్తుకు "తిరోగమనం" లేదా "తిరోగమనం" చెందింది. అందువల్ల, సగటున, పొడవాటి తండ్రులకు పొట్టి (కానీ ఇంకా పొడవు) కొడుకులు ఉంటారు, మరియు పొట్టి తండ్రులకు పొడవైన (కానీ ఇంకా పొట్టి) కొడుకులు ఉంటారు.
మేము స్క్రీనింగ్ మరియు క్లినికల్ ట్రయల్స్లో సగటు తిరోగమనాన్ని చూస్తాము, ఇక్కడ రోగుల ఉపసమితి చికిత్స కోసం ఎంపిక చేయబడవచ్చు, ఎందుకంటే వారి కొలెస్ట్రాల్ యొక్క నిర్దిష్ట వేరియబుల్ స్థాయిలు చాలా ఎక్కువగా ఉంటాయి (లేదా తక్కువ). ఈ కొలత కాలక్రమేణా పునరావృతమైతే, ఉప సమూహం యొక్క రెండవ పఠనం యొక్క సగటు సాధారణంగా మొదటి పఠనం కంటే తక్కువగా ఉంటుంది, వారి చికిత్సతో సంబంధం లేకుండా జనాభాలో వయస్సు మరియు లింగ-సరిపోలిన సగటు వైపు మొగ్గు చూపుతుంది (అనగా, తిరోగమనం). స్వీకరించు.. వారి మొదటి సందర్శనలో అధిక కొలెస్ట్రాల్ ఆధారంగా క్లినికల్ ట్రయల్లో రిక్రూట్ చేయబడిన రోగులు ఆ కాలంలో చికిత్స చేయకపోయినా, వారి రెండవ సందర్శనలో కొలెస్ట్రాల్ స్థాయిలలో సగటు తగ్గుదలని చూపించే అవకాశం ఉంది.
తరచుగా రిగ్రెషన్ విశ్లేషణ యొక్క పద్ధతి భౌతిక అభివృద్ధి యొక్క సూత్రప్రాయ ప్రమాణాలు మరియు ప్రమాణాలను అభివృద్ధి చేయడానికి ఉపయోగించబడుతుంది.
రిగ్రెషన్ లైన్ డేటాకు ఎంత బాగా సరిపోతుందో గుణకం R (సాధారణంగా ఒక శాతంగా వ్యక్తీకరించబడుతుంది మరియు కోరిలేషన్ కోఎఫీషియంట్ (r 2) యొక్క వర్గానికి సమానమైన గుణకం యొక్క గుణకం అని పిలుస్తారు) గణించడం ద్వారా అంచనా వేయవచ్చు. ఇది xతో సంబంధం ద్వారా వివరించబడే y యొక్క వ్యత్యాసం యొక్క నిష్పత్తి లేదా శాతాన్ని సూచిస్తుంది, అనగా. స్వతంత్ర లక్షణం యొక్క ప్రభావంతో అభివృద్ధి చెందిన లక్షణం-ఫలితం యొక్క వైవిధ్యం యొక్క నిష్పత్తి. ఇది 0 నుండి 1 వరకు లేదా వరుసగా 0 నుండి 100% పరిధిలో విలువలను తీసుకోవచ్చు. వ్యత్యాసం (100% - R) అనేది ఈ పరస్పర చర్య ద్వారా వివరించలేని yలోని వ్యత్యాస శాతం.
ఉదాహరణ
పిల్లలలో ఎత్తు (సెం.మీ.లో కొలుస్తారు) మరియు సిస్టోలిక్ రక్తపోటు (SBP, mmHgలో కొలుస్తారు) మధ్య సంబంధం. మేము SBP వర్సెస్ ఎత్తు (Fig. 6) యొక్క జతవైపు లీనియర్ రిగ్రెషన్ విశ్లేషణను చేసాము. ఎత్తు మరియు SBP మధ్య ముఖ్యమైన సరళ సంబంధం ఉంది.
మూర్తి 6. సిస్టోలిక్ రక్తపోటు మరియు ఎత్తు మధ్య సంబంధాన్ని చూపే బివేరియేట్ గ్రాఫ్. అంచనా వేసిన రిగ్రెషన్ లైన్, సిస్టోలిక్ రక్తపోటు చూపబడింది.
అంచనా వేసిన రిగ్రెషన్ లైన్ సమీకరణం క్రింది విధంగా ఉంది:
తోట \u003d 46.28 + 0.48 x ఎత్తు.
ఈ ఉదాహరణలో, అంతరాయానికి ఆసక్తి లేదు (సున్నా పెరుగుదల స్పష్టంగా అధ్యయనంలో గమనించిన పరిధికి వెలుపల ఉంది). అయితే, మేము వాలును అర్థం చేసుకోవచ్చు; ఈ పిల్లలలో SBP సగటున 0.48 mmHg పెరుగుతుందని అంచనా వేయబడింది. ఒక సెంటీమీటర్ ఎత్తు పెరుగుదలతో
ఇచ్చిన ఎత్తులో పిల్లలలో మనం ఆశించే SBPని అంచనా వేయడానికి మేము రిగ్రెషన్ సమీకరణాన్ని వర్తింపజేయవచ్చు. ఉదాహరణకు, 115 సెం.మీ పొడవున్న పిల్లవాడు 46.28 + (0.48 x 115) = 101.48 mm Hg SBPని అంచనా వేస్తాడు. కళ., 130 ఎత్తు ఉన్న పిల్లల అంచనా SBP, 46.28 + (0.48 x 130) = 108.68 mm Hg. కళ.
సహసంబంధ గుణకాన్ని లెక్కించేటప్పుడు, ఇది 0.55కి సమానం అని కనుగొనబడింది, ఇది సగటు బలం యొక్క ప్రత్యక్ష సహసంబంధాన్ని సూచిస్తుంది. ఈ సందర్భంలో, నిర్ణయం గుణకం r 2 \u003d 0.55 2 \u003d 0.3. అందువల్ల, పిల్లలలో రక్తపోటు స్థాయిపై పెరుగుదల ప్రభావం యొక్క వాటా వరుసగా 30% మించదని మేము చెప్పగలం, 70% ప్రభావం ఇతర కారకాల వాటాపై వస్తుంది.
లీనియర్ (సింపుల్) రిగ్రెషన్ అనేది డిపెండెంట్ వేరియబుల్ మరియు ఒకే ఒక ఇండిపెండెంట్ వేరియబుల్ మధ్య సంబంధాన్ని పరిగణనలోకి తీసుకోవడానికి పరిమితం చేయబడింది. సంబంధంలో ఒకటి కంటే ఎక్కువ స్వతంత్ర వేరియబుల్ ఉంటే, అప్పుడు మనం బహుళ రిగ్రెషన్కు వెళ్లాలి. అటువంటి రిగ్రెషన్ కోసం సమీకరణం ఇలా కనిపిస్తుంది:
y = a + bx 1 + b 2 x 2 +.... + b n x n
ప్రతిస్పందన వేరియబుల్ yపై అనేక స్వతంత్ర వేరియబుల్స్ x 1, x 2, .., x n ప్రభావం ఫలితంగా ఒకరు ఆసక్తి కలిగి ఉండవచ్చు. ఈ x లు పరస్పరం ఆధారపడతాయని మనం అనుకుంటే, ఒక x విలువను y ద్వారా మార్చడం వల్ల కలిగే ప్రభావాన్ని మనం విడిగా చూడకూడదు, కానీ అన్ని ఇతర x ల విలువలను ఏకకాలంలో పరిగణనలోకి తీసుకోవాలి.
ఉదాహరణ
పిల్లల ఎత్తు మరియు శరీర బరువు మధ్య బలమైన సంబంధం ఉన్నందున, పిల్లల శరీర బరువు మరియు లింగాన్ని కూడా పరిగణనలోకి తీసుకున్నప్పుడు ఎత్తు మరియు సిస్టోలిక్ రక్తపోటు మధ్య సంబంధం కూడా మారుతుందా అని ఎవరైనా ఆశ్చర్యపోవచ్చు. బహుళ లీనియర్ రిగ్రెషన్ y పై ఈ బహుళ స్వతంత్ర వేరియబుల్స్ యొక్క మిశ్రమ ప్రభావాన్ని పరిశీలిస్తుంది.
ఈ సందర్భంలో బహుళ రిగ్రెషన్ సమీకరణం ఇలా ఉంటుంది:
గార్డెన్ \u003d 79.44 - (0.03 x ఎత్తు) + (1.18 x బరువు) + (4.23 x సెక్స్) *
* - (లింగం కోసం, విలువలు 0 - అబ్బాయి, 1 - అమ్మాయి)
ఈ సమీకరణం ప్రకారం, 115 సెం.మీ పొడవు మరియు 37 కిలోల బరువు ఉన్న అమ్మాయికి SBP ఉంటుందని అంచనా వేయబడింది:
గార్డెన్ \u003d 79.44 - (0.03 x 115) + (1.18 x 37) + (4.23 x 1) \u003d 123.88 mm Hg.
లాజిస్టిక్ రిగ్రెషన్ లీనియర్ రిగ్రెషన్తో సమానంగా ఉంటుంది; మనకు ఆసక్తి కలిగించే బైనరీ ఫలితం (అనగా ఒక లక్షణం ఉండటం/లేకపోవడం లేదా వ్యాధి ఉన్న/లేని విషయం) మరియు ప్రిడిక్టర్ల సమితి ఉన్నప్పుడు ఇది ఉపయోగించబడుతుంది. లాజిస్టిక్ రిగ్రెషన్ ఈక్వేషన్ నుండి, ఏ ప్రిడిక్టర్లు ఫలితాన్ని ప్రభావితం చేస్తాయో గుర్తించడం సాధ్యమవుతుంది మరియు రోగి యొక్క ప్రిడిక్టర్ల విలువలను ఉపయోగించి, అతను/ఆమె ఒక నిర్దిష్ట ఫలితాన్ని పొందే సంభావ్యతను అంచనా వేయవచ్చు. ఉదాహరణకు: సమస్యలు తలెత్తుతాయి లేదా ఉండవు, చికిత్స ప్రభావవంతంగా ఉంటుంది లేదా కాదు.
రెండు ఫలితాలను సూచించడానికి బైనరీ వేరియబుల్ని సృష్టించడం ప్రారంభించండి (ఉదా "వ్యాధి ఉంది" = 1, "వ్యాధి లేదు" = 0). అయినప్పటికీ, మేము ఈ రెండు విలువలను లీనియర్ రిగ్రెషన్ విశ్లేషణలో డిపెండెంట్ వేరియబుల్గా అన్వయించలేము ఎందుకంటే సాధారణత ఊహ ఉల్లంఘించబడింది మరియు మేము సున్నా లేదా ఒకటి లేని అంచనా విలువలను అర్థం చేసుకోలేము.
వాస్తవానికి, బదులుగా, మేము ఆధారిత వేరియబుల్ యొక్క సమీప వర్గంలో (అంటే "వ్యాధి ఉంది") వర్గీకరించబడిన సంభావ్యతను తీసుకుంటాము మరియు గణితపరమైన ఇబ్బందులను అధిగమించడానికి, రిగ్రెషన్ సమీకరణంలో లాజిస్టిక్ పరివర్తనను వర్తింపజేస్తాము - సహజ సంవర్గమానం "వ్యాధి" (p) యొక్క సంభావ్యత మరియు "ఏ వ్యాధి" (1-p) యొక్క సంభావ్యత యొక్క నిష్పత్తి.
సాధారణ రిగ్రెషన్ కంటే గరిష్ట సంభావ్యత పద్ధతి అని పిలువబడే ఒక సమగ్ర ప్రక్రియ (మేము లీనియర్ రిగ్రెషన్ విధానాన్ని వర్తింపజేయలేము కాబట్టి) నమూనా డేటా నుండి లాజిస్టిక్ రిగ్రెషన్ సమీకరణం యొక్క అంచనాను సృష్టిస్తుంది.
logit(p) = a + bx 1 + b 2 x 2 +.... + b n x n
logit (p) అనేది x 1 ... x n కోసం వ్యక్తిగత విలువలను కలిగి ఉన్న రోగికి వ్యాధి ఉన్న నిజమైన సంభావ్యత యొక్క విలువ యొక్క అంచనా;
a - స్థిరాంకం యొక్క మూల్యాంకనం (ఉచిత పదం, ఖండన);
b 1 , b 2 ,... ,b n — లాజిస్టిక్ రిగ్రెషన్ కోఎఫీషియంట్స్ యొక్క అంచనాలు.
1. పాఠం యొక్క అంశంపై ప్రశ్నలు:
1. ఫంక్షనల్ మరియు కోరిలేషన్ యొక్క నిర్వచనం ఇవ్వండి.
2. ప్రత్యక్ష మరియు రివర్స్ సహసంబంధానికి ఉదాహరణలు ఇవ్వండి.
3. లక్షణాల మధ్య బలహీనమైన, మధ్యస్థ మరియు బలమైన సంబంధాల కోసం సహసంబంధ గుణకాల పరిమాణాన్ని సూచించండి.
4. ఏ సందర్భాలలో సహసంబంధ గుణకాన్ని లెక్కించడానికి ర్యాంక్ పద్ధతి ఉపయోగించబడుతుంది?
5. పియర్సన్ సహసంబంధ గుణకం యొక్క గణన ఏ సందర్భాలలో వర్తించబడుతుంది?
6. ర్యాంక్ పద్ధతి ద్వారా సహసంబంధ గుణకాన్ని లెక్కించడంలో ప్రధాన దశలు ఏమిటి?
7. "రిగ్రెషన్" నిర్వచించండి. రిగ్రెషన్ పద్ధతి యొక్క సారాంశం ఏమిటి?
8. సరళమైన లీనియర్ రిగ్రెషన్ సమీకరణం కోసం సూత్రాన్ని వివరించండి.
9. రిగ్రెషన్ కోఎఫీషియంట్ను నిర్వచించండి.
10. ఎత్తు కోసం బరువు యొక్క రిగ్రెషన్ కోఎఫీషియంట్ 0.26 కేజీ/సెం.మీ అయితే ఏ ముగింపును తీసుకోవచ్చు?
11. రిగ్రెషన్ ఈక్వేషన్ ఫార్ములా దేనికి ఉపయోగించబడుతుంది?
12. నిర్ధారణ గుణకం ఏమిటి?
13. ఏ సందర్భాలలో బహుళ రిగ్రెషన్ సమీకరణం ఉపయోగించబడుతుంది.
14. లాజిస్టిక్ రిగ్రెషన్ యొక్క పద్ధతి దేనికి ఉపయోగించబడుతుంది?
ఒక పని.
ఈ ప్రాంతంలోని తేలికపాటి పరిశ్రమల కోసం, మూలధన పెట్టుబడుల పరిమాణంపై (Y, మిలియన్ రూబిళ్లు) అవుట్పుట్ వాల్యూమ్ (Y, మిలియన్ రూబిళ్లు) ఆధారపడటాన్ని వివరించే సమాచారం పొందబడింది.
టేబుల్ 1.
మూలధన పెట్టుబడుల పరిమాణంపై ఉత్పత్తి పరిమాణంపై ఆధారపడటం.
X | ||||||||||
వై |
అవసరం:
1. లీనియర్ రిగ్రెషన్ సమీకరణం యొక్క పారామితులను కనుగొనండి, రిగ్రెషన్ కోఎఫీషియంట్ యొక్క ఆర్థిక వివరణను ఇవ్వండి.
2. అవశేషాలను లెక్కించండి; చతురస్రాల అవశేష మొత్తాన్ని కనుగొనండి; అవశేషాల వ్యత్యాసాన్ని అంచనా వేయండి; అవశేషాలను ప్లాట్ చేయండి.
3. LSM ముందస్తు అవసరాల నెరవేర్పును తనిఖీ చేయండి.
4. స్టూడెంట్స్ టి-టెస్ట్ (α = 0.05) ఉపయోగించి రిగ్రెషన్ సమీకరణం యొక్క పారామితుల ప్రాముఖ్యతను తనిఖీ చేయండి.
5. నిర్ధారణ గుణకాన్ని లెక్కించండి, ఫిషర్ యొక్క F - ప్రమాణం (α = 0.05) ఉపయోగించి రిగ్రెషన్ సమీకరణం యొక్క ప్రాముఖ్యతను తనిఖీ చేయండి, సగటు సాపేక్ష ఉజ్జాయింపు లోపాన్ని కనుగొనండి. మోడల్ నాణ్యత గురించి తీర్పు ఇవ్వండి.
6. కారకం X యొక్క అంచనా విలువ దాని గరిష్ట విలువలో 80% అయితే, సూచిక Y యొక్క సగటు విలువను α = 0.1 యొక్క ప్రాముఖ్యత స్థాయిలో అంచనా వేయండి.
7. సూచన పాయింట్ యొక్క వాస్తవ మరియు మోడల్ Y విలువలను గ్రాఫికల్గా ప్రదర్శించండి.
8. నాన్-లీనియర్ రిగ్రెషన్ సమీకరణాలను కంపోజ్ చేయండి మరియు వాటి గ్రాఫ్లను రూపొందించండి:
అతిశయోక్తి;
శక్తి;
ప్రదర్శనాత్మకమైనది.
9. ఈ నమూనాల కోసం, గుణకాలు మరియు సగటు సంబంధిత ఉజ్జాయింపు దోషాలను కనుగొనండి. ఈ లక్షణాల ప్రకారం నమూనాలను సరిపోల్చండి మరియు తీర్మానం చేయండి.
లీనియర్ రిగ్రెషన్ సమీకరణం యొక్క పారామితులను కనుగొని, రిగ్రెషన్ కోఎఫీషియంట్ యొక్క ఆర్థిక వివరణను అందిద్దాం.
లీనియర్ రిగ్రెషన్ సమీకరణం: ,
a మరియు b పారామితులను కనుగొనే గణనలు టేబుల్ 2లో ఇవ్వబడ్డాయి.
పట్టిక 2.
లీనియర్ రిగ్రెషన్ సమీకరణం యొక్క పారామితులను కనుగొనడానికి విలువల గణన.
రిగ్రెషన్ సమీకరణం: y = 13.8951 + 2.4016*x.
మూలధన పెట్టుబడుల పరిమాణం (X) 1 మిలియన్ రూబిళ్లు పెరగడంతో. అవుట్పుట్ వాల్యూమ్ (Y) సగటున 2.4016 మిలియన్ రూబిళ్లు పెరుగుతుంది. అందువలన, సంకేతాల యొక్క సానుకూల సహసంబంధం ఉంది, ఇది సంస్థల సామర్థ్యాన్ని మరియు వారి కార్యకలాపాలలో పెట్టుబడుల లాభదాయకతను సూచిస్తుంది.
2. మిగిలిన వాటిని లెక్కించండి; చతురస్రాల అవశేష మొత్తాన్ని కనుగొనండి; అవశేషాల వ్యత్యాసాన్ని అంచనా వేయండి మరియు అవశేషాలను ప్లాట్ చేయండి.
మిగిలినవి ఫార్ములా ద్వారా లెక్కించబడతాయి: ఇ i = y i - y అంచనా.
స్క్వేర్డ్ విచలనాల అవశేష మొత్తం: = 207.74.
అవశేష వ్యాప్తి: 25.97.
లెక్కలు టేబుల్ 3లో చూపబడ్డాయి.
పట్టిక 3
№ | వై | X | Y=a+b*x i | e i = y i - y అంచనా. | ఇ ఐ 2 |
100,35 | 3,65 | 13,306 | |||
81,14 | -4,14 | 17,131 | |||
117,16 | -0,16 | 0,0269 | |||
138,78 | -1,78 | 3,1649 | |||
136,38 | 6,62 | 43,859 | |||
143,58 | 0,42 | 0,1744 | |||
73,93 | 8,07 | 65,061 | |||
102,75 | -1,75 | 3,0765 | |||
136,38 | -4,38 | 19,161 | |||
83,54 | -6,54 | 42,78 | |||
మొత్తం | 0,00 | 207,74 | |||
సగటు | 111,4 | 40,6 |
అవశేష గ్రాఫ్ ఇలా కనిపిస్తుంది:
చిత్రం 1. అవశేషాల చార్ట్
3. LSM యొక్క ముందస్తు అవసరాల నెరవేర్పును తనిఖీ చేయండి, ఇందులో అంశాలు ఉన్నాయి:
- యాదృచ్ఛిక భాగం యొక్క గణిత నిరీక్షణ యొక్క సమానత్వాన్ని సున్నాకి తనిఖీ చేయడం;
- అవశేషాల యాదృచ్ఛిక స్వభావం;
- స్వాతంత్ర్య తనిఖీ;
- సాధారణ పంపిణీ చట్టానికి అనేక అవశేషాల అనురూప్యం.
సున్నాకి అవశేషాల శ్రేణి స్థాయిల గణిత నిరీక్షణ యొక్క సమానతను తనిఖీ చేస్తోంది.
సంబంధిత శూన్య పరికల్పన H 0: ధృవీకరణ సమయంలో ఇది నిర్వహించబడుతుంది. ఈ ప్రయోజనం కోసం, ఒక t-గణాంకం నిర్మించబడింది, ఎక్కడ .
కాబట్టి పరికల్పన అంగీకరించబడింది.
అవశేషాల యాదృచ్ఛిక స్వభావం.
టర్నింగ్ పాయింట్ల ప్రమాణాన్ని ఉపయోగించి అవశేషాల శ్రేణి స్థాయిల యాదృచ్ఛికతను తనిఖీ చేద్దాం:
టర్నింగ్ పాయింట్ల సంఖ్య అవశేషాల పట్టిక నుండి నిర్ణయించబడుతుంది:
№ | e i = y i - y అంచనా. | టర్నింగ్ పాయింట్లు | ఇ ఐ 2 | (ఇ ఐ - ఇ ఐ -1) 2 |
3,65 | 13,31 | |||
-4,14 | * | 17,13 | 60,63 | |
-0,16 | * | 0,03 | 15,80 | |
-1,78 | * | 3,16 | 2,61 | |
6,62 | * | 43,86 | 70,59 | |
0,42 | * | 0,17 | 38,50 | |
8,07 | * | 65,06 | 58,50 | |
-1,75 | * | 3,08 | 96,43 | |
-4,38 | 19,16 | 6,88 | ||
-6,54 | 42,78 | 4,68 | ||
మొత్తం | 0,00 | 207,74 | 354,62 | |
సగటు |
= 6 > , కాబట్టి, అవశేషాల యాదృచ్ఛికత యొక్క ఆస్తి సంతృప్తి చెందుతుంది.
అవశేష స్వాతంత్ర్యండర్బిన్-వాట్సన్ పరీక్షను ఉపయోగించి ధృవీకరించబడింది:
=4 -
1,707 = 2,293.
ఇది d 2 నుండి 2 వరకు విరామంలో పడిపోయినందున, ఈ ప్రమాణం ప్రకారం, స్వాతంత్ర్య ఆస్తి సంతృప్తి చెందిందని మేము నిర్ధారించవచ్చు. దీని అర్థం డైనమిక్స్ శ్రేణిలో ఆటోకోరిలేషన్ లేదు, కాబట్టి, ఈ ప్రమాణం ప్రకారం మోడల్ సరిపోతుంది.
సాధారణ పంపిణీ చట్టానికి అనేక అవశేషాల కరస్పాండెన్స్క్లిష్టమైన స్థాయిలతో (2.7-3.7) R/S- ప్రమాణాన్ని ఉపయోగించి నిర్ణయించబడుతుంది;
RS విలువను లెక్కించండి:
RS = (ఇ గరిష్టంగా - ఇ నిమి) / S,
ఇక్కడ e max అనేది అవశేషాల శ్రేణి E(t) = 8.07 స్థాయిల గరిష్ట విలువ;
ఇ నిమి - అవశేషాల శ్రేణి స్థాయిల కనిష్ట విలువ E(t) = -6.54.
S - ప్రామాణిక విచలనం, = 4,8044.
RS \u003d (e max - e min) / S \u003d (8.07 + 6.54) / 4.8044 \u003d 3.04.
2.7 నుండి< 3,04 < 3,7, и полученное значение RS попало в за-данный интервал, значит, выполняется свойство нормальности распределения.
అందువల్ల, LSM యొక్క ముందస్తు అవసరాలను నెరవేర్చడానికి వివిధ ప్రమాణాలను పరిగణనలోకి తీసుకున్న తర్వాత, LSM యొక్క ముందస్తు అవసరాలు నెరవేరాయని మేము నిర్ధారించాము.
4. స్టూడెంట్స్ t-test α = 0.05ని ఉపయోగించి రిగ్రెషన్ సమీకరణం యొక్క పారామితుల ప్రాముఖ్యతను తనిఖీ చేద్దాం.
వ్యక్తిగత రిగ్రెషన్ కోఎఫీషియంట్స్ యొక్క ప్రాముఖ్యతను తనిఖీ చేయడం లెక్కించిన విలువల నిర్ణయంతో ముడిపడి ఉంటుంది t-పరీక్ష (t-గణాంకాలు)సంబంధిత రిగ్రెషన్ కోఎఫీషియంట్స్ కోసం:
అప్పుడు లెక్కించిన విలువలు పట్టికతో పోల్చబడతాయి t టేబుల్= 2.3060. ప్రమాణం యొక్క పట్టిక విలువ ఎప్పుడు నిర్ణయించబడుతుంది ( n- 2) స్వేచ్ఛ డిగ్రీలు ( n-పరిశీలనల సంఖ్య) మరియు సంబంధిత ప్రాముఖ్యత స్థాయి a (0.05)
దీనితో t-పరీక్ష యొక్క లెక్కించబడిన విలువ (n- 2) ఇచ్చిన ప్రాముఖ్యత స్థాయిలో స్వేచ్ఛ యొక్క డిగ్రీలు దాని పట్టిక విలువను మించిపోతాయి, రిగ్రెషన్ కోఎఫీషియంట్ ముఖ్యమైనదిగా పరిగణించబడుతుంది.
మా విషయంలో, రిగ్రెషన్ కోఎఫీషియంట్స్ ఒక 0 - అతితక్కువ, మరియు 1 - ముఖ్యమైన గుణకాలు.
రిగ్రెషన్ లైన్ అనేది దృగ్విషయాల మధ్య సంబంధం యొక్క గ్రాఫికల్ ప్రతిబింబం. మీరు ఎక్సెల్లో రిగ్రెషన్ లైన్ను సులభంగా నిర్మించవచ్చు.
దీని కోసం మీకు ఇది అవసరం:
1. ఎక్సెల్ ప్రోగ్రామ్ను తెరవండి
2. డేటాతో నిలువు వరుసలను సృష్టించండి. మా ఉదాహరణలో, ఫస్ట్-గ్రేడర్లలో దూకుడు మరియు స్వీయ సందేహం మధ్య మేము రిగ్రెషన్ లైన్ లేదా సంబంధాన్ని ఏర్పరుస్తాము. ప్రయోగంలో 30 మంది పిల్లలు పాల్గొన్నారు, డేటా Excel పట్టికలో ప్రదర్శించబడింది:
1 నిలువు వరుస - విషయం యొక్క సంఖ్య
2 నిలువు వరుస - దూకుడుపాయింట్లలో
3 నిలువు వరుస - ఆత్మగౌరవం లేకపోవడంపాయింట్లలో
3. అప్పుడు మీరు రెండు నిలువు వరుసలను (కాలమ్ పేరు లేకుండా) ఎంచుకోవాలి, ట్యాబ్ నొక్కండి చొప్పించు , ఎంచుకోండి పాయింట్ , మరియు ప్రతిపాదిత లేఅవుట్ల నుండి మొదటిదాన్ని ఎంచుకోండి గుర్తులతో చుక్క .
4. కాబట్టి మేము రిగ్రెషన్ లైన్ కోసం ఖాళీని పొందాము - అని పిలవబడేది - స్కాటర్ప్లాట్. రిగ్రెషన్ లైన్కు వెళ్లడానికి, మీరు ఫలిత బొమ్మపై క్లిక్ చేయాలి, ట్యాబ్పై క్లిక్ చేయండి నిర్మాణకర్త, ప్యానెల్లో కనుగొనండి చార్ట్ లేఅవుట్లు మరియు ఎంచుకోండి ఎం a ket9 , అని కూడా చెప్పింది f(x)
5. కాబట్టి, మనకు రిగ్రెషన్ లైన్ ఉంది. గ్రాఫ్ దాని సమీకరణం మరియు సహసంబంధ గుణకం యొక్క వర్గాన్ని కూడా చూపుతుంది
6. గ్రాఫ్ పేరు, అక్షాల పేరు జోడించడానికి ఇది మిగిలి ఉంది. అలాగే, కావాలనుకుంటే, మీరు లెజెండ్ను తీసివేయవచ్చు, క్షితిజ సమాంతర గ్రిడ్ లైన్ల సంఖ్యను తగ్గించవచ్చు (ట్యాబ్ లేఅవుట్ , అప్పుడు గ్రిడ్ ) ప్రధాన మార్పులు మరియు సెట్టింగ్లు ట్యాబ్లో చేయబడతాయి లేఅవుట్
రిగ్రెషన్ లైన్ MS Excelలో నిర్మించబడింది. ఇప్పుడు దానిని పని యొక్క వచనానికి జోడించవచ్చు.
మునుపటి నోట్స్లో, మ్యూచువల్ ఫండ్ రిటర్న్లు, వెబ్ పేజీ లోడ్ సమయం లేదా శీతల పానీయాల వినియోగం వంటి ఒకే సంఖ్యా వేరియబుల్పై తరచుగా దృష్టి కేంద్రీకరించబడింది. ఇందులో మరియు క్రింది గమనికలలో, ఒకటి లేదా అంతకంటే ఎక్కువ ఇతర సంఖ్యా వేరియబుల్స్ యొక్క విలువలను బట్టి సంఖ్యా వేరియబుల్ యొక్క విలువలను అంచనా వేసే పద్ధతులను మేము పరిశీలిస్తాము.
పదార్థం ఉదాహరణ ద్వారా వివరించబడుతుంది. బట్టల దుకాణంలో విక్రయాల పరిమాణాన్ని అంచనా వేయడం.సన్ఫ్లవర్స్ డిస్కౌంట్ దుస్తుల దుకాణాల గొలుసు 25 సంవత్సరాలుగా నిరంతరం విస్తరిస్తోంది. అయితే, కొత్త అవుట్లెట్లను ఎంచుకోవడానికి కంపెనీకి ప్రస్తుతం క్రమబద్ధమైన విధానం లేదు. కంపెనీ ఒక కొత్త స్టోర్ను తెరవాలని భావిస్తున్న ప్రదేశం ఆత్మాశ్రయ పరిశీలనల ఆధారంగా నిర్ణయించబడుతుంది. ఎంపిక ప్రమాణాలు అనుకూలమైన అద్దె పరిస్థితులు లేదా స్టోర్ యొక్క ఆదర్శ స్థానం గురించి మేనేజర్ యొక్క ఆలోచన. మీరు ప్రత్యేక ప్రాజెక్టులు మరియు ప్రణాళిక విభాగానికి అధిపతి అని ఊహించుకోండి. కొత్త స్టోర్లను తెరవడానికి వ్యూహాత్మక ప్రణాళికను అభివృద్ధి చేయడం మీకు అప్పగించబడింది. ఈ ప్లాన్లో కొత్తగా తెరిచిన స్టోర్లలో వార్షిక విక్రయాల సూచన ఉండాలి. స్థలాన్ని విక్రయించడం నేరుగా ఆదాయానికి సంబంధించినదని మీరు విశ్వసిస్తున్నారు మరియు మీ నిర్ణయం తీసుకునే ప్రక్రియలో ఆ వాస్తవాన్ని కారకం చేయాలనుకుంటున్నారు. కొత్త స్టోర్ పరిమాణం ఆధారంగా వార్షిక విక్రయాలను అంచనా వేసే గణాంక నమూనాను మీరు ఎలా అభివృద్ధి చేస్తారు?
సాధారణంగా, వేరియబుల్ విలువలను అంచనా వేయడానికి రిగ్రెషన్ విశ్లేషణ ఉపయోగించబడుతుంది. కనీసం ఒక స్వతంత్ర, లేదా వివరణాత్మక, వేరియబుల్ విలువల నుండి ఆధారపడిన వేరియబుల్ లేదా ప్రతిస్పందన యొక్క విలువలను అంచనా వేసే గణాంక నమూనాను అభివృద్ధి చేయడం దీని లక్ష్యం. ఈ నోట్లో, మేము సరళమైన లీనియర్ రిగ్రెషన్ను పరిశీలిస్తాము - డిపెండెంట్ వేరియబుల్ యొక్క విలువలను అంచనా వేయడానికి మిమ్మల్ని అనుమతించే గణాంక పద్ధతి వైస్వతంత్ర వేరియబుల్ విలువల ద్వారా X. కింది గమనికలు స్వతంత్ర వేరియబుల్ విలువలను అంచనా వేయడానికి రూపొందించిన బహుళ రిగ్రెషన్ మోడల్ను వివరిస్తాయి వైఅనేక డిపెండెంట్ వేరియబుల్స్ విలువల ద్వారా ( X 1 , X 2 , …, X k).
నోట్ని లేదా ఫార్మాట్లో డౌన్లోడ్ చేసుకోండి, ఫార్మాట్లో ఉదాహరణలు
రిగ్రెషన్ నమూనాల రకాలు
ఎక్కడ ρ 1 ఆటోకోరిలేషన్ కోఎఫీషియంట్; ఉంటే ρ 1 = 0 (స్వయం సహసంబంధం లేదు), డి≈ 2; ఉంటే ρ 1 ≈ 1 (పాజిటివ్ ఆటోకోరిలేషన్), డి≈ 0; ఉంటే ρ 1 = -1 (ప్రతికూల స్వయం సహసంబంధం), డి ≈ 4.
ఆచరణలో, డర్బిన్-వాట్సన్ ప్రమాణం యొక్క అనువర్తనం విలువ యొక్క పోలికపై ఆధారపడి ఉంటుంది డిక్లిష్టమైన సైద్ధాంతిక విలువలతో డి ఎల్మరియు డి యుఇచ్చిన సంఖ్యలో పరిశీలనల కోసం n, మోడల్ యొక్క స్వతంత్ర వేరియబుల్స్ సంఖ్య కె(సాధారణ లీనియర్ రిగ్రెషన్ కోసం కె= 1) మరియు ప్రాముఖ్యత స్థాయి α. ఒకవేళ ఎ డి< d L , యాదృచ్ఛిక విచలనాల స్వాతంత్ర్యం యొక్క పరికల్పన తిరస్కరించబడింది (అందుకే, సానుకూల స్వయంప్రతిపత్తి ఉంది); ఉంటే డి > డి యు, పరికల్పన తిరస్కరించబడలేదు (అనగా, స్వయంసిద్ధ సంబంధం లేదు); ఉంటే డి ఎల్< D < d U నిర్ణయం తీసుకోవడానికి తగినంత కారణం లేదు. లెక్కించిన విలువ ఎప్పుడు డి 2 మించిపోయింది, అప్పుడు డి ఎల్మరియు డి యుగుణకం పోల్చబడలేదు డి, మరియు వ్యక్తీకరణ (4- డి).
ఎక్సెల్లో డర్బిన్-వాట్సన్ గణాంకాలను లెక్కించడానికి, మేము అంజీర్లోని దిగువ పట్టికకు వెళ్తాము. పద్నాలుగు బ్యాలెన్స్ ఉపసంహరణ. వ్యక్తీకరణ (10)లోని న్యూమరేటర్ ఫంక్షన్ = SUMMQDIFF(శ్రేణి1, అర్రే2), మరియు హారం = SUMMQ(అరే) (Fig. 16) ఉపయోగించి లెక్కించబడుతుంది.
అన్నం. 16. డర్బిన్-వాట్సన్ గణాంకాలను లెక్కించడానికి సూత్రాలు
మా ఉదాహరణలో డి= 0.883. ప్రధాన ప్రశ్న ఏమిటంటే: డర్బిన్-వాట్సన్ గణాంకం యొక్క ఏ విలువను సానుకూల స్వీయ సహసంబంధం ఉందని నిర్ధారించేంత చిన్నదిగా పరిగణించాలి? D యొక్క విలువను క్లిష్టమైన విలువలతో పరస్పరం అనుసంధానించడం అవసరం ( డి ఎల్మరియు డి యు) పరిశీలనల సంఖ్యను బట్టి nమరియు ప్రాముఖ్యత స్థాయి α (Fig. 17).
అన్నం. 17. డర్బిన్-వాట్సన్ గణాంకాల యొక్క క్లిష్టమైన విలువలు (టేబుల్ ఫ్రాగ్మెంట్)
అందువల్ల, మీ ఇంటికి వస్తువులను పంపిణీ చేసే దుకాణంలో అమ్మకాల పరిమాణం సమస్యలో, ఒక స్వతంత్ర వేరియబుల్ ( కె= 1), 15 పరిశీలనలు ( n= 15) మరియు ప్రాముఖ్యత స్థాయి α = 0.05. తత్ఫలితంగా, డి ఎల్= 1.08 మరియు డియు= 1.36. ఎందుకంటే డి = 0,883 < డి ఎల్= 1.08, అవశేషాల మధ్య సానుకూల స్వయంప్రతిపత్తి ఉంది, కనీసం చతురస్రాల పద్ధతి వర్తించదు.
వాలు మరియు సహసంబంధ గుణకం గురించి పరికల్పనలను పరీక్షించడం
పై రిగ్రెషన్ అంచనా కోసం మాత్రమే వర్తించబడింది. రిగ్రెషన్ కోఎఫీషియంట్లను గుర్తించడానికి మరియు వేరియబుల్ విలువను అంచనా వేయడానికి వైఇచ్చిన వేరియబుల్ విలువ కోసం Xకనీసం చతురస్రాల పద్ధతి ఉపయోగించబడింది. అదనంగా, మేము అంచనా యొక్క ప్రామాణిక లోపాన్ని మరియు మిశ్రమ సహసంబంధం యొక్క గుణకాన్ని పరిగణించాము. అవశేష విశ్లేషణ అతితక్కువ చతురస్రాల పద్ధతి యొక్క వర్తించే పరిస్థితులు ఉల్లంఘించబడలేదని నిర్ధారిస్తే మరియు నమూనా డేటా ఆధారంగా సరళమైన సరళ రిగ్రెషన్ మోడల్ సరిపోతుంది, జనాభాలో వేరియబుల్స్ మధ్య సరళ సంబంధం ఉందని వాదించవచ్చు.
అప్లికేషన్t - వాలు కోసం ప్రమాణాలు.జనాభా వాలు β 1 సున్నాకి సమానంగా ఉందో లేదో తనిఖీ చేయడం ద్వారా, వేరియబుల్స్ మధ్య గణాంకపరంగా ముఖ్యమైన సంబంధం ఉందో లేదో నిర్ధారించవచ్చు Xమరియు వై. ఈ పరికల్పన తిరస్కరించబడితే, వేరియబుల్స్ మధ్య అని వాదించవచ్చు Xమరియు వైఒక సరళ సంబంధం ఉంది. శూన్య మరియు ప్రత్యామ్నాయ పరికల్పనలు క్రింది విధంగా రూపొందించబడ్డాయి: H 0: β 1 = 0 (సరళ సంబంధం లేదు), H1: β 1 ≠ 0 (సరళ సంబంధం ఉంది). నిర్వచనం ప్రకారం t-గణాంకం నమూనా వాలు మరియు ఊహాత్మక జనాభా వాలు మధ్య వ్యత్యాసానికి సమానం, వాలు అంచనా యొక్క ప్రామాణిక లోపంతో విభజించబడింది:
(11) t = (బి 1 – β 1 ) / Sb 1
ఎక్కడ బి 1
నమూనా డేటా ఆధారంగా ప్రత్యక్ష తిరోగమనం యొక్క వాలు, β1 అనేది ప్రత్యక్ష సాధారణ జనాభా యొక్క ఊహాత్మక వాలు, , మరియు పరీక్ష గణాంకాలు tఇది కలిగి ఉంది t- పంపిణీతో n - 2స్వేచ్ఛ యొక్క డిగ్రీలు.
α = 0.05 వద్ద స్టోర్ పరిమాణం మరియు వార్షిక విక్రయాల మధ్య గణాంకపరంగా ముఖ్యమైన సంబంధం ఉందో లేదో చూద్దాం. t-ఉపయోగిస్తున్నప్పుడు ఇతర పారామితులతో పాటు ప్రమాణాలు ప్రదర్శించబడతాయి విశ్లేషణ ప్యాకేజీ(ఎంపిక తిరోగమనం) విశ్లేషణ ప్యాకేజీ యొక్క పూర్తి ఫలితాలు అంజీర్లో చూపబడ్డాయి. 4, t-గణాంకాలకు సంబంధించిన ఒక భాగం - అంజీర్లో. పద్దెనిమిది.
అన్నం. 18. అప్లికేషన్ ఫలితాలు t
ఎందుకంటే దుకాణాల సంఖ్య n= 14 (Fig. 3 చూడండి), క్లిష్టమైన విలువ tప్రాముఖ్యత స్థాయి α = 0.05 వద్ద గణాంకాలను ఫార్ములా ద్వారా కనుగొనవచ్చు: టి ఎల్=STUDENT.INV(0.025;12) = -2.1788 ఇక్కడ 0.025 సగం ప్రాముఖ్యత స్థాయి మరియు 12 = n – 2; టి యు\u003d STUDENT.INV (0.975, 12) \u003d +2.1788.
ఎందుకంటే t-గణాంకాలు = 10.64 > టి యు= 2.1788 (Fig. 19), శూన్య పరికల్పన H 0తిరస్కరించబడింది. మరోవైపు, ఆర్- కోసం విలువ X\u003d 10.6411, ఫార్ములా ద్వారా లెక్కించబడుతుంది \u003d 1-STUDENT.DIST (D3, 12, TRUE), ఇది దాదాపు సున్నాకి సమానం, కాబట్టి పరికల్పన H 0మళ్లీ తిరస్కరించబడింది. నిజానికి ఆ ఆర్-విలువ దాదాపు సున్నా, అంటే స్టోర్ పరిమాణం మరియు వార్షిక విక్రయాల మధ్య నిజమైన సరళ సంబంధం లేకుంటే, లీనియర్ రిగ్రెషన్ ఉపయోగించి దానిని గుర్తించడం దాదాపు అసాధ్యం. అందువల్ల, సగటు వార్షిక స్టోర్ అమ్మకాలు మరియు స్టోర్ పరిమాణం మధ్య గణాంకపరంగా ముఖ్యమైన సరళ సంబంధం ఉంది.
అన్నం. 19. 0.05 మరియు 12 డిగ్రీల స్వేచ్ఛ యొక్క ప్రాముఖ్యత స్థాయిలో సాధారణ జనాభా యొక్క వాలు గురించి పరికల్పనను పరీక్షించడం
అప్లికేషన్ఎఫ్ - వాలు కోసం ప్రమాణాలు.సరళమైన లీనియర్ రిగ్రెషన్ యొక్క వాలు గురించి పరికల్పనలను పరీక్షించడానికి ప్రత్యామ్నాయ విధానాన్ని ఉపయోగించడం ఎఫ్- ప్రమాణాలు. అని గుర్తుచేసుకోండి ఎఫ్-రెండు వ్యత్యాసాల మధ్య సంబంధాన్ని పరీక్షించడానికి ప్రమాణం ఉపయోగించబడుతుంది (వివరాలను చూడండి). స్లోప్ పరికల్పనను పరీక్షించేటప్పుడు, యాదృచ్ఛిక లోపాల కొలత లోపం వైవిధ్యం (స్క్వేర్డ్ లోపాల మొత్తం స్వేచ్ఛ డిగ్రీల సంఖ్యతో భాగించబడుతుంది), కాబట్టి ఎఫ్-టెస్ట్ రిగ్రెషన్ ద్వారా వివరించబడిన వైవిధ్యం యొక్క నిష్పత్తిని ఉపయోగిస్తుంది (అంటే, విలువలు SSRస్వతంత్ర వేరియబుల్స్ సంఖ్యతో విభజించబడింది కె), లోపం వైవిధ్యానికి ( MSE=S YX 2 ).
నిర్వచనం ప్రకారం ఎఫ్లోపం భేదం (MSE)తో భాగించబడిన రిగ్రెషన్ (MSR) కారణంగా గణాంకం సగటు స్క్వేర్డ్ విచలనానికి సమానం: ఎఫ్ = MSR/ MSE, ఎక్కడ MSR =SSR / కె, MSE =SSE/(n– k – 1), kరిగ్రెషన్ మోడల్లోని స్వతంత్ర వేరియబుల్స్ సంఖ్య. పరీక్ష గణాంకాలు ఎఫ్ఇది కలిగి ఉంది ఎఫ్- పంపిణీతో కెమరియు n– కె – 1స్వేచ్ఛ యొక్క డిగ్రీలు.
ఇచ్చిన ప్రాముఖ్యత స్థాయి α కోసం, నిర్ణయ నియమం క్రింది విధంగా రూపొందించబడింది: అయితే F > Fయు, శూన్య పరికల్పన తిరస్కరించబడింది; లేకపోతే, అది తిరస్కరించబడదు. వ్యత్యాసం యొక్క విశ్లేషణ యొక్క సారాంశ పట్టిక రూపంలో సమర్పించబడిన ఫలితాలు అంజీర్లో చూపబడ్డాయి. ఇరవై.
అన్నం. 20. రిగ్రెషన్ కోఎఫీషియంట్ యొక్క గణాంక ప్రాముఖ్యత యొక్క పరికల్పనను పరీక్షించడానికి వైవిధ్యం యొక్క విశ్లేషణ పట్టిక
అదేవిధంగా t- ప్రమాణం ఎఫ్-ఉపయోగిస్తున్నప్పుడు ప్రమాణాలు పట్టికలో ప్రదర్శించబడతాయి విశ్లేషణ ప్యాకేజీ(ఎంపిక తిరోగమనం) పని యొక్క పూర్తి ఫలితాలు విశ్లేషణ ప్యాకేజీఅంజీర్లో చూపబడింది. 4, సంబంధించిన శకలం ఎఫ్-గణాంకాలు - అంజీర్లో. 21.
అన్నం. 21. అప్లికేషన్ ఫలితాలు ఎఫ్- Excel విశ్లేషణ టూల్ప్యాక్ ఉపయోగించి పొందిన ప్రమాణాలు
F-గణాంకం 113.23 మరియు ఆర్విలువ సున్నాకి దగ్గరగా ఉంటుంది (సెల్ ప్రాముఖ్యతఎఫ్) ప్రాముఖ్యత స్థాయి α 0.05 అయితే, క్లిష్టమైన విలువను నిర్ణయించండి ఎఫ్ఫార్ములా నుండి ఒకటి మరియు 12 డిగ్రీల స్వేచ్ఛతో పంపిణీలను పొందవచ్చు ఎఫ్ యు\u003d F. OBR (1-0.05; 1; 12) \u003d 4.7472 (Fig. 22). ఎందుకంటే ఎఫ్ = 113,23 > ఎఫ్ యు= 4.7472, మరియు ఆర్- విలువ 0కి దగ్గరగా ఉంటుంది< 0,05, нулевая гипотеза H 0తప్పుతుంది, అనగా. స్టోర్ పరిమాణం దాని వార్షిక అమ్మకాల పరిమాణంతో దగ్గరి సంబంధం కలిగి ఉంటుంది.
అన్నం. 22. సాధారణ జనాభా యొక్క వాలు గురించి పరికల్పనను 0.05 ప్రాముఖ్యత స్థాయిలో ఒకటి మరియు 12 డిగ్రీల స్వేచ్ఛతో పరీక్షించడం
వాలు β 1 కలిగి ఉన్న విశ్వాస విరామం.వేరియబుల్స్ మధ్య సరళ సంబంధం ఉనికి గురించి పరికల్పనను పరీక్షించడానికి, మీరు β 1 వాలును కలిగి ఉన్న విశ్వాస విరామాన్ని నిర్మించవచ్చు మరియు ఊహాజనిత విలువ β 1 = 0 ఈ విరామానికి చెందినదని నిర్ధారించుకోండి. β 1 వాలును కలిగి ఉన్న విశ్వాస విరామం యొక్క కేంద్రం నమూనా వాలు బి 1 , మరియు దాని సరిహద్దులు పరిమాణాలు బి 1 ±t n –2 Sb 1
అంజీర్లో చూపిన విధంగా. పద్దెనిమిది, బి 1 = +1,670, n = 14, Sb 1 = 0,157. t 12 \u003d STUDENT.OBR (0.975, 12) \u003d 2.1788. తత్ఫలితంగా, బి 1 ±t n –2 Sb 1 = +1.670 ± 2.1788 * 0.157 = +1.670 ± 0.342, లేదా + 1.328 ≤ β 1 ≤ +2.012. అందువల్ల, 0.95 సంభావ్యత కలిగిన జనాభా యొక్క వాలు +1.328 నుండి +2.012 (అంటే, $1,328,000 నుండి $2,012,000 వరకు) పరిధిలో ఉంటుంది. ఈ విలువలు సున్నా కంటే ఎక్కువగా ఉన్నందున, వార్షిక అమ్మకాలు మరియు స్టోర్ ప్రాంతం మధ్య గణాంకపరంగా ముఖ్యమైన సరళ సంబంధం ఉంది. విశ్వాస విరామం సున్నాని కలిగి ఉంటే, వేరియబుల్స్ మధ్య సంబంధం ఉండదు. అదనంగా, విశ్వాస విరామం అంటే ప్రతి 1,000 చ.కి. అడుగుల ఫలితంగా సగటు అమ్మకాలు $1,328,000 నుండి $2,012,000 వరకు పెరుగుతాయి.
వాడుకt సహసంబంధ గుణకం కోసం ప్రమాణాలు.సహసంబంధ గుణకం ప్రవేశపెట్టబడింది ఆర్, ఇది రెండు సంఖ్యా వేరియబుల్స్ మధ్య సంబంధం యొక్క కొలత. రెండు వేరియబుల్స్ మధ్య గణాంకపరంగా ముఖ్యమైన సంబంధం ఉందో లేదో తెలుసుకోవడానికి దీనిని ఉపయోగించవచ్చు. రెండు వేరియబుల్స్ యొక్క జనాభా మధ్య సహసంబంధ గుణకాన్ని ρ గుర్తుతో సూచిస్తాము. శూన్య మరియు ప్రత్యామ్నాయ పరికల్పనలు క్రింది విధంగా రూపొందించబడ్డాయి: H 0: ρ = 0 (సంబంధం లేదు), H 1: ρ ≠ 0 (ఒక సహసంబంధం ఉంది). సహసంబంధం యొక్క ఉనికిని తనిఖీ చేస్తోంది:
ఎక్కడ ఆర్ = + , ఉంటే బి 1 > 0, ఆర్ = – , ఉంటే బి 1 < 0. Тестовая статистика tఇది కలిగి ఉంది t- పంపిణీతో n - 2స్వేచ్ఛ యొక్క డిగ్రీలు.
సన్ఫ్లవర్స్ స్టోర్ గొలుసు సమస్యలో r2= 0.904, మరియు బి 1- +1.670 (Fig. 4 చూడండి). ఎందుకంటే బి 1> 0, వార్షిక విక్రయాలు మరియు స్టోర్ పరిమాణం మధ్య సహసంబంధ గుణకం ఆర్= +√0.904 = +0.951. ఉపయోగించి ఈ వేరియబుల్స్ మధ్య ఎటువంటి సహసంబంధం లేదని శూన్య పరికల్పనను పరీక్షిద్దాం t- గణాంకాలు:
α = 0.05 యొక్క ప్రాముఖ్యత స్థాయిలో, శూన్య పరికల్పన తిరస్కరించబడాలి ఎందుకంటే t= 10.64 > 2.1788. అందువల్ల, వార్షిక అమ్మకాలు మరియు స్టోర్ పరిమాణం మధ్య గణాంకపరంగా ముఖ్యమైన సంబంధం ఉందని వాదించవచ్చు.
జనాభా వాలుల గురించి అనుమానాలను చర్చిస్తున్నప్పుడు, విశ్వాస విరామాలు మరియు పరికల్పనలను పరీక్షించడానికి ప్రమాణాలు పరస్పరం మార్చుకోగల సాధనాలు. అయితే, గణాంకం యొక్క నమూనా పంపిణీ రూపం నుండి సహసంబంధ గుణకం కలిగి ఉన్న విశ్వాస విరామం యొక్క గణన మరింత కష్టంగా మారుతుంది. ఆర్నిజమైన సహసంబంధ గుణకంపై ఆధారపడి ఉంటుంది.
గణిత నిరీక్షణ అంచనా మరియు వ్యక్తిగత విలువల అంచనా
ఈ విభాగం ఆశించిన ప్రతిస్పందనను అంచనా వేయడానికి పద్ధతులను చర్చిస్తుంది వైమరియు వ్యక్తిగత విలువల అంచనాలు వైవేరియబుల్ ఇచ్చిన విలువల కోసం X.
విశ్వాస విరామం నిర్మాణం.ఉదాహరణ 2 (ఎగువ విభాగం చూడండి తక్కువ చదరపు పద్ధతి) రిగ్రెషన్ సమీకరణం వేరియబుల్ విలువను అంచనా వేయడం సాధ్యం చేసింది వై X. రిటైల్ అవుట్లెట్ కోసం స్థానాన్ని ఎంచుకోవడం సమస్యలో, 4000 చదరపు మీటర్ల విస్తీర్ణంలో ఉన్న స్టోర్లో సగటు వార్షిక అమ్మకాలు. అడుగులు 7.644 మిలియన్ డాలర్లకు సమానం.అయితే, సాధారణ జనాభా యొక్క గణిత అంచనాల ఈ అంచనా ఒక పాయింట్. సాధారణ జనాభా యొక్క గణిత నిరీక్షణను అంచనా వేయడానికి, విశ్వాస విరామం అనే భావన ప్రతిపాదించబడింది. అదేవిధంగా, ఒక భావనను పరిచయం చేయవచ్చు ప్రతిస్పందన యొక్క గణిత నిరీక్షణకు విశ్వాస విరామంవేరియబుల్ ఇచ్చిన విలువ కోసం X:
ఎక్కడ , =
బి 0
+
బి 1
X i- అంచనా విలువ వేరియబుల్ వైవద్ద X = X i, S YXసగటు స్క్వేర్ లోపం, nనమూనా పరిమాణం, Xi- వేరియబుల్ ఇచ్చిన విలువ X, µ
వై|X =
Xiఅనేది వేరియబుల్ యొక్క నిరీక్షణ వైవద్ద X = Х i,SSX=
ఫార్ములా (13) యొక్క విశ్లేషణ విశ్వాస విరామం యొక్క వెడల్పు అనేక అంశాలపై ఆధారపడి ఉంటుందని చూపిస్తుంది. ఇచ్చిన ప్రాముఖ్యత స్థాయిలో, రిగ్రెషన్ లైన్ చుట్టూ హెచ్చుతగ్గుల వ్యాప్తిలో పెరుగుదల, సగటు స్క్వేర్ ఎర్రర్ను ఉపయోగించి కొలుస్తారు, ఇది విరామం యొక్క వెడల్పు పెరుగుదలకు దారితీస్తుంది. మరోవైపు, ఊహించినట్లుగా, నమూనా పరిమాణంలో పెరుగుదల విరామం యొక్క సంకుచితంతో కూడి ఉంటుంది. అదనంగా, విలువలను బట్టి విరామం యొక్క వెడల్పు మారుతుంది Xi. వేరియబుల్ విలువ అయితే వైపరిమాణాల కోసం అంచనా వేయబడింది X, సగటు విలువకు దగ్గరగా ఉంటుంది , విశ్వాస విరామం సగటుకు దూరంగా ఉన్న విలువలకు ప్రతిస్పందనను అంచనా వేసేటప్పుడు కంటే ఇరుకైనదిగా మారుతుంది.
స్టోర్ కోసం లొకేషన్ను ఎంచుకునేటప్పుడు, 4000 చదరపు మీటర్ల విస్తీర్ణంలో ఉన్న అన్ని స్టోర్లలో సగటు వార్షిక అమ్మకాల కోసం మేము 95% విశ్వాస విరామాన్ని నిర్మించాలనుకుంటున్నాము. అడుగులు:
అందువల్ల, 4,000 చదరపు మీటర్ల విస్తీర్ణంలో ఉన్న అన్ని స్టోర్లలో సగటు వార్షిక అమ్మకాల పరిమాణం. అడుగులు, 95% సంభావ్యతతో 6.971 నుండి 8.317 మిలియన్ డాలర్ల పరిధిలో ఉంటుంది.
అంచనా వేసిన విలువకు విశ్వాస విరామాన్ని గణించండి.వేరియబుల్ యొక్క ఇచ్చిన విలువ కోసం ప్రతిస్పందన యొక్క గణిత నిరీక్షణ కోసం విశ్వాస విరామంతో పాటు X, అంచనా వేయబడిన విలువకు విశ్వాస విరామాన్ని తెలుసుకోవడం తరచుగా అవసరం. అటువంటి విశ్వాస విరామాన్ని లెక్కించే ఫార్ములా ఫార్ములా (13)కి చాలా సారూప్యంగా ఉన్నప్పటికీ, ఈ విరామం అంచనా విలువను కలిగి ఉంటుంది మరియు పరామితి యొక్క అంచనా కాదు. ఊహించిన ప్రతిస్పందన కోసం విరామం వైX = Xiవేరియబుల్ యొక్క నిర్దిష్ట విలువ వద్ద Xiసూత్రం ద్వారా నిర్ణయించబడుతుంది:
రిటైల్ అవుట్లెట్ కోసం లొకేషన్ను ఎంచుకునేటప్పుడు, 4000 చదరపు మీటర్ల విస్తీర్ణంలో ఉన్న స్టోర్లో అంచనా వేసిన వార్షిక విక్రయాల పరిమాణం కోసం మేము 95% విశ్వాస విరామాన్ని నిర్మించాలనుకుంటున్నాము. అడుగులు:
అందువల్ల, 4,000 చ.కి.కి అంచనా వేసిన వార్షిక విక్రయాల పరిమాణం. అడుగులు, 95% సంభావ్యతతో 5.433 నుండి 9.854 మిలియన్ డాలర్ల పరిధిలో ఉంటుంది. మీరు చూడగలిగినట్లుగా, అంచనా వేసిన ప్రతిస్పందన విలువకు విశ్వాస విరామం దాని గణిత నిరీక్షణకు విశ్వాస విరామం కంటే చాలా విస్తృతంగా ఉంటుంది. ఎందుకంటే వ్యక్తిగత విలువలను అంచనా వేయడంలో వైవిధ్యం ఊహించిన విలువను అంచనా వేయడం కంటే చాలా ఎక్కువగా ఉంటుంది.
రిగ్రెషన్ ఉపయోగంతో సంబంధం ఉన్న ఆపదలు మరియు నైతిక సమస్యలు
రిగ్రెషన్ విశ్లేషణతో సంబంధం ఉన్న ఇబ్బందులు:
- కనీసం చతురస్రాల పద్ధతి యొక్క వర్తించే పరిస్థితులను విస్మరించడం.
- కనీసం చతురస్రాల పద్ధతిని వర్తించే పరిస్థితుల యొక్క తప్పుడు అంచనా.
- కనీసం చతురస్రాల పద్ధతి యొక్క వర్తించే పరిస్థితులను ఉల్లంఘిస్తూ ప్రత్యామ్నాయ పద్ధతుల యొక్క తప్పు ఎంపిక.
- అధ్యయనం విషయం గురించి లోతైన జ్ఞానం లేకుండా రిగ్రెషన్ విశ్లేషణ యొక్క అప్లికేషన్.
- వివరణాత్మక వేరియబుల్ పరిధిని దాటి రిగ్రెషన్ యొక్క ఎక్స్ట్రాపోలేషన్.
- గణాంక మరియు కారణ సంబంధాల మధ్య గందరగోళం.
స్ప్రెడ్షీట్లు మరియు గణాంక సాఫ్ట్వేర్ యొక్క విస్తృత ఉపయోగం రిగ్రెషన్ విశ్లేషణను ఉపయోగించకుండా నిరోధించే గణన సమస్యలను తొలగించింది. అయినప్పటికీ, ఇది తగినంత అర్హతలు మరియు జ్ఞానం లేని వినియోగదారులచే రిగ్రెషన్ విశ్లేషణను ఉపయోగించడం ప్రారంభించింది. చాలా మందికి కనీసం స్క్వేర్ల పద్ధతిని వర్తింపజేయడానికి షరతుల గురించి అస్సలు తెలియదు మరియు వాటి అమలును ఎలా తనిఖీ చేయాలో తెలియకపోతే ప్రత్యామ్నాయ పద్ధతుల గురించి వినియోగదారులకు ఎలా తెలుసు?
పరిశోధకుడు సంఖ్యలను గ్రౌండింగ్ చేయడం ద్వారా దూరంగా ఉండకూడదు - షిఫ్ట్, వాలు మరియు మిశ్రమ సహసంబంధ గుణకం లెక్కించడం. అతనికి లోతైన జ్ఞానం అవసరం. పాఠ్యపుస్తకాల నుండి తీసుకోబడిన ఒక క్లాసిక్ ఉదాహరణతో దీనిని ఉదహరిద్దాం. అన్ని నాలుగు డేటాసెట్లు అంజీర్లో చూపబడినట్లు Anscombe చూపించింది. 23 అదే రిగ్రెషన్ పారామితులను కలిగి ఉంటాయి (Fig. 24).
అన్నం. 23. నాలుగు కృత్రిమ డేటా సెట్లు
అన్నం. 24. నాలుగు కృత్రిమ డేటా సెట్ల రిగ్రెషన్ విశ్లేషణ; తో పూర్తయింది విశ్లేషణ ప్యాకేజీ(చిత్రాన్ని పెద్దదిగా చేయడానికి చిత్రంపై క్లిక్ చేయండి)
కాబట్టి, రిగ్రెషన్ విశ్లేషణ యొక్క దృక్కోణం నుండి, ఈ డేటా సెట్లన్నీ పూర్తిగా ఒకేలా ఉంటాయి. విశ్లేషణ అక్కడ ముగిసి ఉంటే, మేము చాలా ఉపయోగకరమైన సమాచారాన్ని కోల్పోతాము. ఈ డేటా సెట్ల కోసం నిర్మించిన స్కాటర్ ప్లాట్లు (Fig. 25) మరియు అవశేష ప్లాట్లు (Fig. 26) ద్వారా ఇది రుజువు చేయబడింది.
అన్నం. 25. నాలుగు డేటాసెట్ల కోసం స్కాటర్ ప్లాట్లు
స్కాటర్ ప్లాట్లు మరియు అవశేష ప్లాట్లు ఈ డేటా ఒకదానికొకటి భిన్నంగా ఉన్నాయని చూపుతాయి. సరళ రేఖ వెంట పంపిణీ చేయబడిన ఏకైక సెట్ A సెట్ చేయబడింది. సెట్ A నుండి లెక్కించబడిన అవశేషాల ప్లాట్కు నమూనా లేదు. B, C మరియు D సెట్ల కోసం అదే చెప్పలేము. B సెట్ కోసం ప్లాట్ చేసిన స్కాటర్ ప్లాట్లో ఉచ్ఛరించే చతుర్భుజ నమూనా చూపబడుతుంది. ఈ ముగింపు అవశేషాల ప్లాట్ ద్వారా నిర్ధారించబడింది, ఇది పారాబొలిక్ ఆకారాన్ని కలిగి ఉంటుంది. స్కాటర్ ప్లాట్ మరియు అవశేష ప్లాట్లు B డేటాసెట్ అవుట్లియర్ను కలిగి ఉన్నట్లు చూపుతాయి. ఈ పరిస్థితిలో, డేటా సెట్ నుండి అవుట్లియర్ను మినహాయించడం మరియు విశ్లేషణను పునరావృతం చేయడం అవసరం. పరిశీలనల నుండి బయటి వ్యక్తులను గుర్తించడం మరియు తొలగించే సాంకేతికతను ప్రభావ విశ్లేషణ అంటారు. అవుట్లియర్ను తొలగించిన తర్వాత, మోడల్ యొక్క పునః-మూల్యాంకనం యొక్క ఫలితం పూర్తిగా భిన్నంగా ఉండవచ్చు. డేటా సెట్ D నుండి ప్లాట్ చేయబడిన ఒక స్కాటర్ప్లాట్ ఒక అసాధారణ పరిస్థితిని వివరిస్తుంది, దీనిలో అనుభావిక నమూనా ఒకే ప్రతిస్పందనపై ఎక్కువగా ఆధారపడి ఉంటుంది ( X 8 = 19, వై 8 = 12.5). ఇటువంటి రిగ్రెషన్ నమూనాలను ప్రత్యేకంగా జాగ్రత్తగా లెక్కించాల్సిన అవసరం ఉంది. కాబట్టి, స్కాటర్ మరియు అవశేష ప్లాట్లు రిగ్రెషన్ విశ్లేషణకు అవసరమైన సాధనం మరియు దానిలో అంతర్భాగంగా ఉండాలి. అవి లేకుండా, రిగ్రెషన్ విశ్లేషణ నమ్మదగినది కాదు.
అన్నం. 26. నాలుగు డేటాసెట్ల కోసం అవశేషాల ప్లాట్లు
రిగ్రెషన్ విశ్లేషణలో ఆపదలను ఎలా నివారించాలి:
- వేరియబుల్స్ మధ్య సాధ్యం సంబంధం యొక్క విశ్లేషణ Xమరియు వైఎల్లప్పుడూ స్కాటర్ప్లాట్తో ప్రారంభించండి.
- రిగ్రెషన్ విశ్లేషణ ఫలితాలను వివరించే ముందు, దాని వర్తించే పరిస్థితులను తనిఖీ చేయండి.
- స్వతంత్ర చరరాశికి వ్యతిరేకంగా అవశేషాలను ప్లాట్ చేయండి. ఇది అనుభావిక నమూనా పరిశీలన ఫలితాలకు ఎలా అనుగుణంగా ఉందో గుర్తించడానికి మరియు వైవిధ్యం యొక్క స్థిరత్వం యొక్క ఉల్లంఘనను గుర్తించడానికి అనుమతిస్తుంది.
- లోపాల యొక్క సాధారణ పంపిణీ యొక్క ఊహను పరీక్షించడానికి హిస్టోగ్రామ్లు, కాండం మరియు ఆకు ప్లాట్లు, బాక్స్ ప్లాట్లు మరియు సాధారణ పంపిణీ ప్లాట్లను ఉపయోగించండి.
- అతి తక్కువ చతురస్రాల పద్ధతి యొక్క వర్తించే పరిస్థితులు నెరవేరకపోతే, ప్రత్యామ్నాయ పద్ధతులను ఉపయోగించండి (ఉదాహరణకు, క్వాడ్రాటిక్ లేదా బహుళ రిగ్రెషన్ నమూనాలు).
- అతి తక్కువ చతురస్రాల పద్ధతి యొక్క అనువర్తన పరిస్థితులు నెరవేరినట్లయితే, రిగ్రెషన్ కోఎఫీషియంట్స్ యొక్క గణాంక ప్రాముఖ్యత గురించి పరికల్పనను పరీక్షించడం మరియు గణిత నిరీక్షణ మరియు అంచనా వేసిన ప్రతిస్పందన విలువను కలిగి ఉన్న విశ్వాస అంతరాలను నిర్మించడం అవసరం.
- ఇండిపెండెంట్ వేరియబుల్ పరిధి వెలుపల డిపెండెంట్ వేరియబుల్ యొక్క విలువలను అంచనా వేయడం మానుకోండి.
- గణాంక డిపెండెన్సీలు ఎల్లప్పుడూ కారణం కాదని గుర్తుంచుకోండి. వేరియబుల్స్ మధ్య సహసంబంధం అంటే వాటి మధ్య కారణ సంబంధం ఉందని అర్థం కాదని గుర్తుంచుకోండి.
సారాంశం.బ్లాక్ రేఖాచిత్రం (Fig. 27)లో చూపిన విధంగా, గమనిక ఒక సాధారణ సరళ రిగ్రెషన్ మోడల్, దాని వర్తించే పరిస్థితులు మరియు ఈ పరిస్థితులను పరీక్షించే మార్గాలను వివరిస్తుంది. పరిగణించబడింది tతిరోగమనం యొక్క వాలు యొక్క గణాంక ప్రాముఖ్యతను పరీక్షించడానికి ప్రమాణం. డిపెండెంట్ వేరియబుల్ యొక్క విలువలను అంచనా వేయడానికి రిగ్రెషన్ మోడల్ ఉపయోగించబడింది. రిటైల్ అవుట్లెట్ కోసం స్థలం ఎంపికకు సంబంధించి ఒక ఉదాహరణ పరిగణించబడుతుంది, దీనిలో స్టోర్ ప్రాంతంపై వార్షిక అమ్మకాల పరిమాణంపై ఆధారపడటం అధ్యయనం చేయబడుతుంది. పొందిన సమాచారం స్టోర్ కోసం ఒక స్థానాన్ని మరింత ఖచ్చితంగా ఎంచుకోవడానికి మరియు దాని వార్షిక విక్రయాలను అంచనా వేయడానికి మిమ్మల్ని అనుమతిస్తుంది. కింది గమనికలలో, రిగ్రెషన్ విశ్లేషణ, అలాగే బహుళ రిగ్రెషన్ నమూనాల చర్చ కొనసాగుతుంది.
అన్నం. 27. నోట్ యొక్క బ్లాక్ రేఖాచిత్రం
లెవిన్ మరియు ఇతరులు పుస్తకంలోని మెటీరియల్లు. మేనేజర్ల కోసం గణాంకాలు ఉపయోగించబడతాయి. - M.: విలియమ్స్, 2004. - p. 792–872
డిపెండెంట్ వేరియబుల్ వర్గీకరణ అయితే, లాజిస్టిక్ రిగ్రెషన్ వర్తింపజేయాలి.