2011년 8월 22일 월요일

stat] 문제 풀이


Harrigan University is a liberal arts university in the Midwest that attempts to attract the highest quality students, especially from its region of the country. It has gathered data on 178 applicants who were accepted by Harrigan (a random sample from all acceptable applicants over the part several years). The data are in the file HARRIGAN.XLS. The variables are:

Accepted : 지원자들 중 해리건에 등록한 학생 수
MainRival : 해리건 대학에 합격했지만 주요한 라이벌 학교에 등록한 학생 수
HSClubs : 봉사활동 참여 수.
HSsports : 스포츠 활동 수.
HSGPA : 고등학교 때의 학점.
HSpctile : 졸업 했을 때의 반에서의 상대적 위치.
HSsize : 졸업학교의 반에서 지원자 수.
SAT : SAT score
Combined score : 모든 점수의 합계

합계 점수의 전개는 Harrigan's 매우 비밀로 지켜졌다. 그러나 그것은 기본적으로 고등학교 때의 다양한 수행활동의 평균과 SAT 점수에 중점을 두었다. 해리건은 최상의 학생들이 오지 않고, 나쁘게도 그들이 라이벌 대학에 갔다고 걱정하고 있다. 다음 문제들을 풀고 당신의 분석에 기초해서, 해리건이 합리적인 고려를 하고 있는 지를 설명하라.

1. 해리건 대학의 등록 초청을 받은 모든 등록한 학생들의 비율의 95% 신뢰구간을 구해라.
모든 acceptable 지원자들 중 combined score가 330이하, 330과 375사이, 375초과의 모든 지원자들에 대해 위와 같이 95%신뢰구간을 구하시오. (330과 375는 대략 Q1, Q3이다)

Test and CI for One Proportion: Accept

Test of p = 0.5 vs p not = 0.5

Event = 1
Exact
Variable X N Sample p 95% CI P-Value
bin 103 178 0.578652 (0.502502, 0.652137) 0.043


Test and CI for One Proportion: x<=330

Test of p = 0.5 vs p not = 0.5
Event = 1
Exact
Variable X N Sample p 95% CI P-Value
x<=330 33 103 0.320388 (0.231841, 0.419574) 0.000

Test and CI for One Proportion: 330

Test of p = 0.5 vs p not = 0.5

Event = 1

Exact
Variable X N Sample p 95% CI P-Value
330(0.433042, 0.632915) 0.555


Test and CI for One Proportion: x>375

Test of p = 0.5 vs p not = 0.5

Event = 1

Exact
Variable X N Sample p 95% CI P-Value
x>375 15 103 0.145631 (0.083861, 0.228798) 0.000


2. 해리건 대학에 합격하였지만 헤리건 대학의 라이벌 학교를 선택한 학생중에 합계 점수가 325점 이하인 학생의 비율의 95% 신뢰구간을 구하시오.

Test and CI for One Proportion: x<=325

Test of p = 0.5 vs p not = 0.5

Event = 1
Exact
Variable X N Sample p 95% CI P-Value
x<=325 10 75 0.133333 (0.065834, 0.231566) 0.000


3. 해리건 대학에 등록 초청을 허락한 모든 Acceptable한 학생들의 고등학교의 GPA와 SAT점수, Combined score의 평균의 95% 신뢰 구간을 구하시오. 해리건 대학에 합격 했지만 다른 곳에 등록한 모든 학생 수에 대해 위와 같이 구하시오. 그리고 해리건 대학에 등록한 학생 수에서 다른 곳에 등록한 학생 수를 뺀 평균차이에 대한 95% 신뢰구간을 구하라.

One-Sample T: YES-HSGPA, SAT, CombinedScore
Variable N Mean StDev SE Mean 95% CI
HSGPA 103 3.27175 0.30131 0.02969 (3.21286, 3.33064)
SAT 103 1180.24 134.65 13.27 (1153.93, 1206.56)
CombinedScore 103 345.718 30.018 2.958 (339.852, 351.585)
One-Sample T: NO-HSGPA_1, SAT_1, CombinedScore_1

Variable N Mean StDev SE Mean 95% CI
HSGPA_1 75 3.35440 0.29311 0.03385 (3.28696, 3.42184)
SAT_1 75 1185.88 140.20 16.19 (1153.62, 1218.14)
CombinedScore_1 75 366.000 31.876 3.681 (358.666, 373.334)

Two-Sample T-Test and CI: YES-HSGPA, NO-HSGPA

Two-sample T for HSGPA vs HSGPA_1

N Mean StDev SE Mean
HSGPA 103 3.272 0.301 0.030
HSGPA_1 75 3.354 0.293 0.034


Difference = mu (HSGPA) - mu (HSGPA_1)
Estimate for difference: -0.082652
95% CI for difference: (-0.171557, 0.006252)
T-Test of difference = 0 (vs not =): T-Value = -1.84 P-Value = 0.068 DF = 162


Two-Sample T-Test and CI: YES-SAT, NO-SAT

Two-sample T for SAT vs SAT_1

SE
N Mean StDev Mean
SAT 103 1180 135 13
SAT_1 75 1186 140 16


Difference = mu (SAT) - mu (SAT_1)
Estimate for difference: -5.63728
95% CI for difference: (-46.98382, 35.70925)
T-Test of difference = 0 (vs not =): T-Value = -0.27 P-Value = 0.788 DF = 155


Two-Sample T-Test and CI: YES -CombinedScore,
NO- CombinedScore




Two-sample T for CombinedScore vs CombinedScore_1

N Mean StDev SE Mean
CombinedScore 103 345.7 30.0 3.0
CombinedScore_1 75 366.0 31.9 3.7


Difference = mu (CombinedScore) - mu (CombinedScore_1)
Estimate for difference: -20.2816
95% CI for difference: (-29.6101, -10.9531)
T-Test of difference = 0 (vs not =): T-Value = -4.30 P-Value = 0.000 DF = 153


4. 해리건 대학은 과외활동을 한 학생들을 얻는 데 관심이 있다. 이것들은 어떻게 표현되어 지는가? 최소한 2개 클럽 활동을 한 학생 중에서 해리건 대학에 등록하기로 결정한 모든 학생들의 비율의 95% 신뢰구간을 찾으시오. 비슷한 방법으로 4개 이상의 학교 대표로 스포츠 활동을 한 학생 중에서 해리건 대학에 등록 하기로 결정한 모든 학생들의 비율을 95% 신뢰구간을 구하시오.

Test and CI for One Proportion: YES-club>=2

Test of p = 0.5 vs p not = 0.5
Event = 1
Exact
Variable X N Sample p 95% CI P-Value
club>=2 83 103 0.805825 (0.716168, 0.877171) 0.000

Test and CI for One Proportion: YES-sport>=4

Test of p = 0.5 vs p not = 0.5

Event = 1
Exact
Variable X N Sample p 95% CI P-Value
sport>=4 78 103 0.757282 (0.662887, 0.836355) 0.000


5. 규모가 작은 학교에서 상위로 랭크된 학생들보다 상대적으로 큰 규모의 학교에서 상위로 랭크된 각각의 학생들에게 어떠한 혜택을 주기 위해서 해리건 대학은 combined score을 개선 할 것이다. 해리건 대학은 작은 학교의 규모보다 큰 규모의 학교로부터 학생들을 끌어오는게 상대적으로 성공적이지 않을까 하고 생각을 한다. 이 주제에 적합한 모수들을 위한 하나 또는 다수의 신뢰구간을 밝히시오.


* 우선 전체 지원자들 규모의 평균을 구해서 작은 규모와 큰 규모를 나누를 기준을 잡는다.
모든 지원자들의 학교 크기의 분포가 정규 분포를 따르므로. 샘플이 균등하다고 할 수 있다. 모든 지원자들의 학교 크기의 평균을 이용한다.
One-Sample T: ALL-HSSize

Variable N Mean StDev SE Mean 95% CI
HSSize 178 292.320 116.954 8.766 (275.021, 309.620)

* 등록자들 중 작은 규모학교의 학생들의 비율과 등록자들 중 큰 규모학교의 학생들의 비율을 구한다.
Test and CI for One Proportion: <292, >=292

Test of p = 0.5 vs p not = 0.5

Event = 1
Exact
Variable X N Sample p 95% CI P-Value
<292 66 103 0.640777 (0.540272, 0.732957) 0.006
>=292 37 103 0.359223 (0.267043, 0.459728) 0.006

# 큰 규모의 학교에서는 학생들을 끌어 오는 것이 별로 효과적이지 못했다고 볼 수 있다.


Demand for systems analysts in the consulting industry is greater than ever. Graduates with a combination of business and computer knowledge-some even from liberal arts programs are getting great offers from consulting companies. Once these people are hired, they frequently switch from one company to another as competing companies lure them away with even better offers. One consulting company, D&Y, has collected data on a sample of systems analysts they hired with an undergraduate degree several years ago. The data are in the file D&Y.XLS. The variables are:

* StartSal : D&Y에서 고용인의 초봉
* OnRoadPct : 도로에서 고객과 보낸 시간의 Percentage
* StateU : 고용인의 주립대학 졸업여부
* CISDegree : 컴퓨터 정보 시스템이나 관련분야의 졸업여부
* Stayed3Yrs : D&Y에서 적어도 3년은 머물렀는지.
* Tenure : 만약에 그 또는 그녀가 3년 이전에 옮겼다면, D&Y에서 고용인의 재직기간

1. 비록 초봉은 꽤 적은 범위에 있지만, D&Y는 그들의 유지와 할 수 있는 것이 있는지 생각한다.
a. 3년 이상 머문 모든 고용자들의 초봉 평균과 3년 이하의 초봉평균, 그리고 그들의 차이의 95%신뢰구간을 구하라.

One-Sample T: Stayed3Yrs - yes
Variable N Mean StDev SE Mean 95% CI
C10 32 37381.3 1806.0 319.3 (36730.1, 38032.4)

One-Sample T: Stayed3Yrs - no
Variable N Mean StDev SE Mean 95% CI
C11 34 38555.9 1887.1 323.6 (37897.4, 39214.3)


Two-Sample T-Test and CI: C10, C11
Two-sample T for C10 vs C11
N Mean StDev SE Mean
C10 32 37381 1806 319
C11 34 38556 1887 324

Difference = mu (C10) - mu (C11)
Estimate for difference: -1174.63
95% CI for difference: (-2083.10, -266.17)
T-Test of difference = 0 (vs not =): T-Value = -2.58 P-Value = 0.012 DF = 63



b. 중간값 이상으로 시작하는 고용자들 중 95%신뢰구간으로 3년이상 근무하는 비율을 구하라.
중간값 이하로 시작하는 고용자들 중 95%신뢰구간으로 3년 이상 근무하는 비율을 구하라.

95%신뢰구간으로 이들 비율의 차이를 구하라.

2. D&Y는 도로에서 보내는 시간의 비율이 누가 머무르고 누가 떠나는지에 영향을 미치는지 염려하고 있다. 앞과 같이 반복하되, 초봉보다 도로에서 보내는 비율에 대해 분석하라.
(길에서 보낸 시간의 중간 비율은 54%이다.)

3. 95%신뢰구간으로 3년 만에 떠난 모든 고용인의 평균 재직기간을 구하라.
왜 D&Y에서 주어진 정보로 D&Y에 의해 고용된 모든 시스템분석가들 사이에 평균재직기간의 신뢰구간을 구하는 것은 불가능한가? 그렇다 - 자료가 없으므로.

4. 주립대학 출생들 특히 CIS 분야의 학생들은 전통적으로 D&Y 고용의 사원으로 남아있다. 하지만 그들은 상대적으로 유지하기 어렵지 않은가? 한가지 또는 그 이상의 당신의 주장을 도와줄 수 있는 한 방법 또는 그 이상의 관련된 신뢰구간을 찾아라.
Test and CI for Two Proportions: 3year, 3year:StateU:CISDegree

Event = 1


Variable X N Sample p
3year 32 66 0.484848
3year:and... 11 66 0.166667


Difference = p (3year) - p (3year:and...)
Estimate for difference: 0.318182
95% CI for difference: (0.167777, 0.468586)
Test for difference = 0 (vs not = 0): Z = 4.15 P-Value = 0.000

* 3년 이상 근무자들 중에 StateU와 CISDegrees가 yes인 비율이 낮다.

Two-Sample T-Test and CI: Tenure, C11

Two-sample T for Tenure vs C11

N Mean StDev SE Mean
Tenure 34 15.29 6.62 1.1
C11 13 13.46 6.46 1.8


Difference = mu (Tenure) - mu (C11)
Estimate for difference: 1.83258
95% CI for difference: (-2.56810, 6.23326)
T-Test of difference = 0 (vs not =): T-Value = 0.86 P-Value = 0.397 DF = 22

* 3년 이하 근속 개월수 에서는 95% 신뢰구간에서 별 차이가 없으므로, 3년을 기준으로 생각했을 때 유지하기 어렵다고 할 수 있다.

댓글 없음:

댓글 쓰기

국정원의 댓글 공작을 지탄합니다.

UPBIT is a South Korean company, and people died of suicide cause of coin investment.

 UPBIT is a South Korean company, and people died of suicide cause of coin. The company helps the people who control the market price manipu...