Stats questions

1. Which of the following would be an appropriate null hypothesis?
a. The population proportion is less than 0.65.
b. The sample proportion is less than 0.65.
c. The population proportion is no less than 0.65.
d. The sample proportion is no less than 0.65.
2. Which of the following would be an appropriate alternative hypothesis?
a. The population proportion is less than 0.65.
b. The sample proportion is less than 0.65.
c. The population proportion is no less than 0.65.
d. The sample proportion is no less than 0.65.
3. If the p value is less than à in a two-tailed test,
a. the null hypothesis should not be rejected.
b. the null hypothesis should be rejected.
c. a one-tailed test should be used.
d. no conclusion should be reached.
4. A major videocassette rental chain is considering opening a new store inan area that currently does not have any such stores. The chain will open if there is evidence that more than 5,000 of the 20,000 households in the area are equipped with videocassette recorders (VCRs). It conducts a telephone poll of 300 randomly selected households in the area and finds that 96 have VCRs. State the test of interest to the rental chain.
a. H0: p ó 0.32 versus H1: p > 0.32
b. H0: p ó 0.25 versus H1: p > 0.25
c. H0: p ó 5,000 versus H1: p > 5,000
d. H0: æ ó 5,000 versus H1: æ > 5,000
TABLE 7-1
Microsoft Excel was used on a set of data involving the number of parasites found on 46 Monarch butterflies captured in Pismo Beach State Park. A biologist wants to know if the mean number of parasites per butterfly is over 20. She will make her decision using a test with a level of 0.10. The following information was extracted from the Microsoft Excel output for the sample of 46 Monarch butterflies:
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³n = 46; Arithmetic Mean = 28.00; Standard Deviation = 25.92; ³
³Standard Error = 3.82; Null Hypothesis: H0: æ ó 20.000; ³
³à = 0.10; df = 45; T Test Statistic = 2.09; ³
³One-Tailed Test Upper Critical Value = 1.3006; p -value = 0.021; ³
³Decision = Reject. ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
5. Referring to Table 7-1, what critical value should the biologist use to determine the rejection region?
a. 1.6794
b. 1.3006
c. 1.3002
d. 1.28
TABLE 7-2
A student claims that he can correctly identify whether a person is a business major or an agriculture major by the way the person dresses.
Suppose in actuality that he can correctly identify a business major 87% of the time, while 16% of the time he mistakenly identifies an agriculture major as a business major. Presented with one person and asked to identify the major of this person (who is either a business or agriculture major), he considers this to be a hypothesis test with the null hypothesis being that the person is a business major and the alternative that the person is an agriculture major.
6. Referring to Table 7-2, what would be a Type I error?
a. Saying that the person is a business major when in fact the person isa business major.
b. Saying that the person is a business major when in fact the person isan agriculture major.
c. Saying that the person is an agriculture major when in fact theperson is a business major.
d. Saying that the person is an agriculture major when in fact theperson is an agriculture major.
7. Referring to Table 7-2, what is the value of á ?
a. 0.13
b. 0.16
c. 0.84
d. 0.87
8. Referring to Table 7-2, what is the power of the test?
a. 0.13
b. 0.16
c. 0.84
d. 0.87
9. To use the Wilcoxon Rank Sum Test as a test for location, we must assumethat
a. the obtained data are either ranks or numerical measurements bothwithin and between the 2 samples.
b. both samples are randomly and independently drawn from theirrespective populations.
c. both underlying populations from which the samples were drawn areequivalent in shape and dispersion.
d. All the above.
10. A local real estate appraiser analyzed the sales prices of homes in 2 neighborhoods to the corresponding appraised values of the homes. The goal of the analysis was to compare the distribution of sale-to-appraised ratios from homes in the 2 neighborhoods. Random and independent samples were selected from the 2 neighborhoods from last year's home sales, eight from each of the 2 neighborhoods. Identify the nonparametric method that would be used to analyze the data.
a. The Wilcoxon Signed-Ranks Test, using the test statistic Z
b. The Wilcoxon Signed-Ranks Test, using the test statistic W
c. The Wilcoxon Rank Sum Test, using the test statistic T1
d. The Wilcoxon Rank Sum Test, using the test statistic Z
TABLE 8-4
A real estate company is interested in testing whether, on average, families in Gotham have been living in their current homes for less time than families in Metropolis have. A random sample of 100 families from Gotham and a random sample of 150 families in Metropolis yield the following data on length of residence in current homes.
Gotham: í G = 35 months, sG2 = 900 Metropolis: íM = 50 months, sM2 = 1050
11. Referring to Table 8-4, what is an unbiased point estimate for the meanof the sampling distribution of the difference between the 2 sample means?
a. -22
b. -10
c. -15
d. 0
12. The sample correlation coefficient between X and Y is 0.375. It has beenfound out that the p -value is 0.256 when testing H0: ï = 0 against the one-sided alternative H1: ï > 0. To test H0: ï = 0 against the two-sided alternative H1: ï Ø 0 at a significance level of 0.193, the p-value is
a. 0.256/2
b. 0.2562
c. 1 - 0.256
d. 1 - 0.256/2
TABLE 11-9
It is believed that, the average numbers of hours spent studying per day
(HOURS) during undergraduate education should have a positive linear relationship with the starting salary (SALARY, measured in thousands of dollars per month) after graduation. Given below is the Excel output from regressing starting salary on number of hours spent studying per day for a sample of 51 students.
NOTE: Some of the numbers in the output are purposely erased.
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression Statistics ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Multiple R 0.8857
R Square 0.7845
Adjusted R Square 0.7801
Standard Error 1.3704 Observations 51 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ANOVA
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ df SS MS F Significance FÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression 1 335.0472 335.0473 178.3859
Residual 1.8782
Total 50 427.0798
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Intercept -1.8940 0.4018 -4.7134 2.051E-05 -2.7015 -1.0865 Hours 0.9795 0.0733 13.3561 5.944E-18 0.8321 1.1269 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
13. Referring to Table 11-9, the value of the measured t-test statistic to test whether average SALARY depends linearly on HOURS is
a. -4.7134
b. -1.8940
c. 0.9795
d. 13.3561
14. Referring to Table 11-9, the degrees of freedom for testing whether
HOURS affects SALARY are
a. 1, 49
b. 1, 50
c. 49, 1
d. 50, 1
15. A real estate builder wishes to determine how house size (House) isinfluenced by family income (Income), family size (Size), and education of the head of household (School). House size is measured in hundreds of square feet, income is measured in thousands of dollars, and education is in years. The builder randomly selected 50 families and ran the multiple regression. The business literature involving human capital shows that education influences an individual's annual income. Combined, these may influence family size. With this in mind, what should the real estate builder be particularly concerned with when analyzing the multiple regression model?
a. Randomness of error terms
b. Collinearity
c. Normality of residuals
d. Missing observations
TABLE 12-6
One of the most common questions of prospective house buyers pertains to the average cost of heating in dollars (Y). To provide its customers with information on that matter, a large real estate firm used the following 4 variables to predict heating costs: the daily minimum outside temperature in degrees of Fahrenheit (X1), the amount of insulation in inches (X2), the number of windows in the house (X3), and the age of the furnace in years (X4). Given below are the EXCEL outputs of two regression models.
Model 1
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression Statistics ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
R Square 0.8080
Adjusted R Square 0.7568 Observations 20 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ANOVA
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ df SS MS F Significance F ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression 4 169503.4241 42375.86 15.7874 2.96869E-05
Residual 15 40262.3259 2684.155
Total 19 209765.75
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Standard Lower Upper Coefficients Error t Stat P-value 90.0% 90.0%ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Intercept 421.4277 77.8614 5.4125 7.2E-05 284.9327 557.9227
X1 (Temperature) -4.5098 0.8129 -5.5476 5.58E-05 -5.9349 -3.0847
X2 (Insulation) -14.9029 5.0508 -2.9505 0.0099 -23.7573 -6.0485
X3 (Windows) 0.2151 4.8675 0.0442 0.9653 -8.3181 8.7484
X4 (Furnace Age) 6.3780 4.1026 1.5546 0.1408 -0.8140 13.5702 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Model 2
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression Statistics ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
R Square 0.7768
Adjusted R Square 0.7506 Observations 20 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ANOVA
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ df SS MS F Significance F ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Regression 2 162958.2277 81479.11 29.5923 2.9036E-06
Residual 17 46807.5222 2753.384
Total 19 209765.75
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Standard
Coefficients Error t Stat P-value Lower 95% Upper 95%ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
Intercept 489.3227 43.9826 11.1253 3.17E-09 396.5273 582.1180
X1 (Temperature) -5.1103 0.6951 -7.3515 1.13E-06 -6.5769 -3.6437
X2 (Insulation) -14.7195 4.8864 -3.0123 0.0078 -25.0290 -4.4099 ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ
16. Referring to Table 12-6, what is the 90% confidence interval for the expected change in average heating costs as a result of a 1 degree Fahrenheit change in the daily minimum outside temperature using Model
1?
a. [-6.58, -3.65]
b. [-6.24, -2.78]
c. [-5.94, -3.08]
d. [-2.37, 15.12]
TABLE 12-2
A professor of industrial relations believes that an individual's wage rate at a factory (Y) depends on his performance rating (X1) and the number of economics courses the employee successfully completed in college (X2). The professor randomly selects 6 workers and collects the following information:
Employee Y ($) X1 X 2 ÄÄÄÄÄÄÄÄ ÄÄÄÄÄ ÄÄ ÄÄ
1 10 3 0
2 12 1 5
3 15 8 1
4 17 5 8
5 20 7 12
6 25 10 9
17. Referring to Table 12-2, suppose an employee had never taken aneconomics course and managed to score a 5 on his performance rating. What is his estimated expected wage rate?
a. 10.90
b. 12.20
c. 17.23
d. 25.11
TABLE 12-19
An automotive engineer would like to be able to predict automobile mileages. She believes that the two most important characteristics that affect mileage are horsepower and the number of cylinders (4 or 6) of a car. She believes that the appropriate model is Y = 40 - 0.05X1 + 20X2 - 0.1X1X2 where X1 = horsepower
X 2 = 1 if 4 cylinders, 0 if 6 cylinders Y = mileage.
18. Referring to Table 12-19, the fitted model for predicting mileages for6-cylinder cars is________.
a. 40 - 0.05X1
b. 40 - 0.10X1
c. 60 - 0.10X1
d. 60 - 0.15X1
TABLE 12-5
A microeconomist wants to determine how corporate sales are influenced by capital and wage spending by companies. She proceeds to randomly select 26 large corporations and record information in millions of dollars. The Microsoft Excel output below shows results of this multiple regression.
ÚÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ¿
³SUMMARY OUTPUT ³ ³ ³ ³ Regression Statistics ³ ³Multiple R 0.830 ³ ³R Square 0.689 ³ ³Adjusted R Square 0.662 ³ ³Standard Error 17501.643 ³ ³Observations 26 ³ ³ ³ ³ANOVA ³ ³ df SS MS F Signif F ³ ³Regression 2 15579777040 7789888520 25.432 0.0001 ³ ³Residual 23 7045072780 306307512 ³ ³Total 25 22624849820 ³ ³ ³ ³ Coeff StdError t Stat P-value ³ ³Intercept 15800.0000 6038.2999 2.617 0.0154 ³ ³Capital 0.1245 0.2045 0.609 0.5485 ³
³Wages 7.0762 1.4729 4.804 0.0001 ³ ÀÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄ ÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÄÙ
19. Referring to Table 12-5, what fraction of the variability in sales is explained by spending on capital and wages?
a. 27.0%
b. 50.9%
c. 68.9%
d. 83.0%
TABLE 12-12
A weight-loss clinic wants to use regression analysis to build a model for weight-loss of a client (measured in pounds). Two variables thought to effect weight-loss are client's length of time on the weight loss program and time of session. These variables are described below:
Y = Weight-loss (in pounds)
X1 = Length of time in weight-loss program (in months)
X2 = 1 if morning session, 0 if not
X3 = 1 if afternoon session, 0 if not (Base level = evening session)
Data for 12 clients on a weight-loss program at the clinic were collected and used to fit the interaction model: Y = á0 + á1X1 + á2X2 + á3X3 + á4X1X2 + á 5X1X3 + ’
Partial output from Microsoft Excel follows:
Regression Statistics
Multiple R 0.73514
R Square 0.540438
Adjusted R Square 0.157469
Standard Error 12.4147
Observations 12
ANOVA
F = 5.41118 Significance F = 0.040201
Coeff StdError t Stat P-value
Intercept 0.089744 14.127 0.0060 0.9951
Length (X1) 6.22538 2.43473 2.54956 0.0479
Morn Ses (X2) 2.217272 22.1416 0.100141 0.9235
Aft Ses (X3) 11.8233 3.1545 3.558901 0.0165
Length*Morn Ses 0.77058 3.562 0.216334 0.8359
Length*Aft Ses -0.54147 3.35988 -0.161158 0.8773
20. Referring to Table 12-12, in terms of the á 's in the model, give the average change in weight-loss (Y) for every 1 month increase in time in the program (X1) when attending the morning session.
a. á1 + á 4
b. á1 + á 5
c. á 1
d. á4 + á 5

-
Rating:
5/
Solution: Stats questions