phân tích hồi quy (regression analysis) là chuyên môn thống kê dùng để ước lượng phương trình phù hợp nhất với các tập hợp hiệu quả quan gần kề của biến phụ thuộc vào và biến đổi độc lập.

Bạn đang xem: Phân tích hồi quy là gì

Phân tích hồi quy (regression analysis) là nghệ thuật thống kê dùng làm ước lượng phương trình phù hợp nhất với những tập hợp tác dụng quan ngay cạnh của biến phụ thuộc và biến hóa độc lập. Nó chất nhận được đạt được tác dụng ước lượng tốt nhất về mối quan hệ sống động giữa những biến số. Từ bỏ phương trình mong lượng được này, tín đồ ta có thể dự báo về biến phụ thuộc (chưa biết) nhờ vào giá trị mang đến trước của biến chủ quyền (đã biết).

Hãy đem ví dụ đơn giản dễ dàng nhất về một phương trình tuyến với một biến độc lập và một phát triển thành phụ thuộc, ví dụ điển hình thu nhập thực hiện và giá cả cho tiêu dùng. Vấn đề đưa ra là yêu cầu vẽ được con đường thẳng phù hợp nhất với tập phù hợp số liệu bao gồm các cặp công dụng quan cạnh bên về thu nhập cá nhân (Y) và chi tiêu và sử dụng (C).

Hình trên bộc lộ tập vừa lòng các kết quả quan sát như vậy dưới dạng đồ gia dụng thị và chúng ta phải tra cứu phương trình của mặt đường thẳng đó với đk nó cân xứng nhất với số lượng mà chúng ta thu thập được, vị một con đường như vậy sẽn mang lại kết quả dự báo rất tốt cho trở thành phụ thuộc. Đường thẳng tương xứng nhất cùng với số liệu buộc phải được lựa chọn làm sao cho giá trị của tổng bình phương các độ lệch (khoảng cách) theo phương trực tiếp đứng giữa các điểm và con đường thẳng là nhỏ nhất. Phương pháp bình phương nhỏ nhất thông thường này được ứng dụng trong phần lớn các so với hồi quy. Tính tương xứng của đường hồi quy cùng với các kết quả quan gần cạnh mẫu được phản ảnh bằng hệ số tương quan.

Đồ thị sống hình trên rất có thể mô tả bằng phương trình con đường tính có dạng:

C = C¯ + c
Y

trong kia C¯ và c là hệ số của phương trình - số lượng ước tính dựa trên các quan sát đơn nhất rút ra từ các tham số sống động tế của tổng thể. Phần lớn hẳng số C¯ và c thu được bằng phương pháp bình phương bé dại nhất thông thường này được hotline là thông số hồi quy ước lượng được. Khi đã có giá trị ngay số của chúng, người ta thực hiện chúng để tham dự báo quý hiếm của biến nhờ vào C lúc biết giá trị của biến chủ quyền Y.

Ví dụ, nếu thông số hồi quy cầu lượng được của C¯ với c lần lượt là 500 và 0.7, phương trình hồi quy đã là C = 500 + 0.7Y, và bạn cũng có thể suy ra rằng, trường hợp thu nhập bằng 10 000 đồng, mức ngân sách cho chi tiêu và sử dụng sẽ bằng :

C = 500 + 0.7Y = 500 + 0.7 x 10000 = 7500

Hệ số hồi quy đề đạt độ dốc của đường hồi quy đường tính c có ý nghĩa sâu sắc đặc biệt đặc biệt trong kinh tế tài chính học, bởi nó cho biết thêm sự biến đổi của biến nhờ vào - trong trường thích hợp này là biến chi tiêu và sử dụng - khi có sự đổi khác bằng một đơn vị chức năng của biến tự do - vào trường đúng theo này là thu nhập. Ví dụ, quý hiếm của c bởi 0.7 cho biết người chi tiêu và sử dụng sẽ bỏ ra 70% thu nhập sử dụng tạo thêm cho mục tiêu tiêu dùng.

Phương trình hồi quy không đem lại dự báo đúng chuẩn về biến phụ thuộc khi biết quý giá của phát triển thành độc lập. Lý do là các hệ số hồi quy ước lượng được từ tác dụng quan giáp mẫu chỉ là số lượng ước lượng tốt nhất cho những tham số sống động của tổng thể, do vậy chúng phụ thuộc vào vào những biến đổi thiên ngẫu nhiên. Hiệu quả là gồm thể cấu hình thiết lập một phân phối tất cả điều kiện để cho các giá chỉ trị có chức năng xuất hiện của biến dựa vào C do phương trình hồi quy dự báo cho một giá trị mang lại trước của biến hòa bình Y. Độ lệch tiêu chuẩn của bày bán có đk này là chỉ báo về những giới hạn mà chúng ta hy vọng rằng chỉ tiêu cho tiêu dùng sẽ rơi vào đó với cùng 1 mức thu nhập cá nhân cho trước. Vụ việc này được phản ánh trong đại lượng thống kê có tên là không đúng số chuẩn của cầu lượng - đại lượng bộc lộ các số lượng giới hạn ước lượng được nhưng trong đó bọn họ hy vọng C vẫn rời vào với 1 Y mang lại trước và một tỷ lệ cho trước, chẳng hạn 0.95 cùng 500, khi đó bạn có thể tin tưởng rằng vào 95% trường hợp, nấc tiêu dùng chân thực tính mang lại mức thu nhập cá nhân 10000 đồng vẫn nằm trong tầm 7500đ - 500 và 7500đ + 500

Để xác thực tính chấ không tuyệt đối của toàn bộ các phương trình hồi quy ước lượng được dựa trên một mẫu khi xác minh mối quan liêu hệ sống động trong tổng thể, phương trình hồi quy thường được viết thành:

C = C¯ + c
Yd + e

tức được bổ sung cập nhật thêm biểu thức biểu thị phần dư hoặc sai số e để phản ánh tác động phụ thêm của việc biến thiên ngẫu nhiên và số đông tác động của các biến số tự do khác, ví dụ lãi vay của tín dụng tiêu dùng - yếu đuối tố ảnh hưởng đến ngân sách chi tiêu cho tiêu dùng, nhưng lại không được bộc lộ rõ vào phương trình hồi quy.

Khi suy nghĩ rằng không hẳn chỉ tất cả một biến đổi số chủ quyền tác động bạo dạn tới biến chuyển số phụ thuộc, bạn ta sử dụng phương pháp hồi quy con đường tính bội. Nghệ thuật này bao hàm việc tùy chỉnh cấu hình một phương trình hồi quy bội tất cả hai hoặc nhiều đổi mới độc lập. Chẳng hạn:

C = C¯ + b
Y + di + e

trong kia i là lãi suất vay của tín dụng tiêu dùng và d là thông số bội quy bổ sung gắn với biến độc lập bổ sung cập nhật i. Câu hỏi ước lượng phương trình hồi quy bội bằng cách thức bình phương bé dại nhất thông thường làm mang đến đồ thị trong không gian ba chiều phù hợp với các tác dụng quan gần kề mẫu và hoàn toàn có thể được sử dụng để mong lượng quý hiếm của ba thông số hồi quy C¯, c với d vào phương trình trên.

Khi những mối dục tình cơ phiên bản giữa những phát triển thành số hòa bình và dựa vào không buộc phải tuyến tính (phi tuyến), phương pháp hồi quy con đường tính không ứng dụng được. Tuy nhiên, những mối quan lại hệ có dạng cong (phi tuyến) có thể chuyển thành quan lại hệ tuyến đường tính bằng cách sử dụng logarit tự nhiên và thoải mái của những biến số, qua đó khiến cho chúng tuân theo phương thức phân tích hồi quy con đường tính.

(Tài liệu tham khảo: Nguyễn Văn Ngọc, tự điển kinh tế tài chính học, Đại học kinh tế tài chính Quốc dân)

Cung cấp một chiếc nhìn tổng quan về cách sử dụng hiệu quả phân tích hồi quy, bao gồm:Ước tính chi phí biến hóa và ngân sách chi tiêu cố định
Xây dựng phương trình giá cả để dự đoán một loạt ngân sách trong tương lai....

I. Mục tiêu

● biểu lộ sự hiểu biết về một phương trình hồi quy đơn giản và dễ dàng (a simple regression equation)● xác minh một phương trình hồi quy bội (multiple regression equation) và nhận biết bao giờ hồi quy bội là một công cụ phù hợp (appropriate) để sử dụng để tham gia báo (forecasting)● Tính toán kết quả (result) của một phương trình hồi quy 1-1 giản.

II. Nội dung

Cung cấp một cái nhìn tổng quan về phong thái sử dụng kết quả phân tích hồi quy, bao gồm:➢ Ước tính chi phí đổi khác và chi phí cố định➢ thi công phương trình giá thành để dự báo một loạt chi phí trong tương lai

*
1. Hồi quy 1-1 (Simple regression)

a. Định nghĩa:Phân tích hồi quy là quy trình rút ra phương trình đường tính (deriving the linear equation) mô tả mối quan hệ giữa hai biến tất cả hệ số tương quan khác không (two variables with a non-zero coefficient of correlation). Nó là một công vắt thống kê được sử dụng để gia công nổi bật các mẫu trong dữ liệu lịch sử.

b. Giải pháp ghi nhận

Phương trình hồi quy dễ dàng và đơn giản là cách làm đại số biểu diễn dưới dạng một đường thẳng:

y = a + bx

*Trong đó:y = phát triển thành phụ thuộca = Giao tuyến yb = Độ dốc của đường hồi quy (the slope of the regression line)x = đổi thay độc lập

c. Ví dụ:Một ví dụ như về bảng chi phí có thể được trình diễn như bên dưới đây:

Quý

Bảng

Chi phí

1

106

$112,300

2

125

$176,750

3

183

$161,000

4

249

$212,125

5

213

$224,300

6

155

$236,360

7

130

$107,800

8

170

$239,500

Dựa trên kết quả được chế tạo ra bởi qui định phân tích,Tổng chi phí = $702 (ô tô) + $65,079


*Lưu ý: Phép Hồi quy đơn sau khi có được bảng số cụ thể thì được chia làm 2 loại hiệu quả , gồm những: Ý nghĩa thống kê lại (Statistical significance) cùng Ý nghĩa thực tiễn (Practical significance).

Xem thêm: Cách nghị luận về lòng biết ơn chọn lọc hay nhất, nghị luận xã hội về lòng biết ơn


Ý nghĩa những thống kê (Statistical significance):Ý nghĩa thống kê lại đề cập mang đến tuyên cha rằng (claim) tác dụng từ dữ liệu được tạo nên (data generated) bởi thử nghiệm hoặc phân tích (testing or experimentation) có công dụng được quy (attributable) mang đến một nguyên nhân cụ thể.Ví dụ: phụ thuộc dữ liệu sinh hoạt ví dụ 1, sử dụng công cố phân tích hồi quy vào Excel, ta tất cả bảng ý nghĩa thống kê của các dự toán:

Hệ số tương quan

Sai số chuẩn

Thống kê kiểm định

Trị số P

Thấp rộng 95%

Vượt 95%

Thấp rộng 80%

Vượt 80%

Giao điểm

$65,079

$63,222

1.03

0.34

($91,585)

$223,683

($26,702)

$158,801

Hệ số bình an vốn(Cars)

$702

$377

1.87

0.11

($219)

$1,624

$160

$1,245

Ý nghĩa trong thực tế (Practical significance):Ý nghĩa thực tiễn đề cập mang đến độ mập của sự biệt lập (magnitude of the difference), được gọi là size hiệu ứng (effect size). Hiệu quả thực tế có ý nghĩa khi sự khác hoàn toàn đủ to để có chân thành và ý nghĩa trong cuộc sống thường ngày thực (meaningful in real life).Dựa vào tài liệu ở lấy một ví dụ 1, thực hiện công cố gắng phân tích hồi quy (regression analysis tools)trong Excel, ta tất cả bảng ý nghĩa thực tế (Practical significance) của phương trình tổng chi phí cho nhà cung cấp bo mạch.

Bội số R(Multiple R)

0.61

R bình phương(R Square)

0.37

R bình phương hiệu chỉnh(Adjusted R Square)

0.26

Sai số chuẩn(Standard Error)

$47,655

Kỹ thuật quan tiếp giáp (Observations)

8

2. Hồi quy bội (Multiple regression)

a. Định nghĩa:

Hồi quy bội (multiple regression) được áp dụng khi có nhiều hơn một biến hòa bình (more than one independent variables).Hồi quy bội có thể chấp nhận được công ty xác định nhiều nguyên tố thay bởi vì chỉ một biến hòa bình và quan tâm đến từng nguyên tố theo ảnh hưởng của nó đối với kết quả chung, do đó làm tăng độ đúng đắn của dự báo.

b. Bí quyết ghi nhận:

Phương trình hồi quy bội:

y = a + b1x1 + b2x2 + … + bnxn

*Trong đó:y = vươn lên là phụ thuộca = Giao tuyến đường yb = Độ dốc của con đường hồi quy (the slope of the regression line)x = biến chuyển độc lập

c. Ví dụ:

Những dữ liệu này đại diện cho 24 học tập kỳ vận động và túi tiền cho một trường đại học:

Học kỳ

Sinh viên đang đăng ký

Phần giảng dạy

Các khóa đào tạo được liệt kê

Tổng giá thành đại học

Mùa thu 06

28,874

7,065

2,670

$117,160,456

Xuân 07

29,091

6,775

2,670

$117,352,268

Mùa thu 07

28,621

6,232

2,628

$115,928,777

Mùa xuân 08

27,310

6,833

2,678

$116,889,599

:

:

:

:

:

Mùa thu 16

29,374

7,521

3,030

$127,352,245

Mùa xuân 17

32,227

7,258

2,820

$128,577,777

Mùa thu 17

31,263

7,249

2,817

$128,408,000

Mùa xuân 18

29,197

7,142

2,876

$129,436,179

Sử dụng cách thức phân tích hồi quy vào Excel™, phân tích hồi quy bội của dữ liệu ở trên được cung ứng bên dưới.Yêu cầu: Phương trình tổng giá cả cho trường đại học là gì và từng nào phương sai chi phí đang được giải thích?

Hệ số tương quan

Sai số chuẩn

Thống kê kiểm định

Trị số P

Thấp hơn 95%

Vượt 95%

Thấp hơn 80%

Vượt 80%

Giao điểm

$19,464,902

$18,869,075

1.03

0.31

($19,895,299)

$58,825,103

($5,543,051)

$44,472,855

Sinh viên vẫn đăng ký

$1,045

$596

1.75

0.09

($198)

$2,287

$255

$1,834

Phần giảng dạy

$4,159

$1,451

2.87

0.01

$1,132

$7,186

$2,236

$6,082

Các khóa huấn luyện được liệt kê

$15,778

$5,529

2.85

0.01

$4,245

$27,311

$8,451

$23,106

Bội số R(Multiple R)

0.83

R bình phương(R Square)

0.68

R bình phương hiệu chỉnh(Adjusted R Square)

0.64

Sai số chuẩn(Standard Error)

$2,698,662

Kỹ thuật quan ngay cạnh (Observations)

24

Hướng dẫn giải:Dựa trên những Hệ số (Coefficients) được hiển thị (displayed) trong cột trước tiên ở trên, phương trình tổng giá thành (cost equation) mang đến trường đại học là:Tổng ngân sách chi tiêu = $1,045 (Sinh viên) + $4,159 (Phần) + $15,778 (Khóa học) + $19,464,902Đối với túi tiền cố định: mong tính tổng ngân sách chi tiêu cố định (Giá trị chặn-(the Intercept) hoàn toàn không đúng chuẩn (not at all precise);lỗi tiêu chuẩn ($18,869,075) mập gần bởi chính cầu tính túi tiền ($19,464,902).Chỉ số t cho ngân sách cố (t-Stat for fixed costs) định nhỏ hơn những so với 2 (trong đó trạng thái t tốt hơn là > 3) giá trị P lớn hơn nhiều 0,10 (trong đó quý giá p xuất sắc hơn là Đối với chi phí biến đổi: ước tính mang đến 3 biến tốt hơn, phần nhiều các biến gồm chỉ số t cao hơn nhiều đối với 2, nước ngoài trừ số lượng sinh viên theo học, giá bán trị phường đều thấp rộng 0,1 khoảng tin tưởng ở cả 95% với 80% phần đông không vượt thừa phạm vi âm (negative range).Ý nghĩa thực tiễn:Với thống kê lại R Square (Adjusted R Square) đã điều chỉnh là 0,64, ước tính ngân sách chi tiêu (cost estimates) trong so với đang lý giải 64% phương không đúng trong tổng chi phí trong tập dữ liệu.Cuối cùng, những nhà thống trị có thể sử dụng Sai số chuẩn (Standard Error) ($2,698,662) để dự đoán tổng chi phí. Ví dụ: nếu giá thành của trường đại học được lên kế hoạch trong học tập kỳ cho tới cho 29.500 sinh viên theo học, để dạy dỗ 7.100 phần có 2.800 khóa đào tạo dành đến sinh viên, phương trình tổng giá cả sẽ là:Tổng ngân sách chi tiêu = $1.045 ( 29.500 ) + $4.159 ( 7.100 ) + $15.778 ( 2.800 ) + $19.464.902 = $123.999.702Người cai quản có thể từ bỏ tin khoảng chừng 68% khi dự báo (approximately 68% confident in forecasting) rằng ngân sách chi tiêu thực tế bên trong khoảng trường đoản cú $121.301.040 mang lại $126.698.364 ( = $123.999.702 ± $2.698.662)

III. Bài bác tập

Example 1 for Simple Regression:

A manufacturing company incurs $500,000 in fixed costs per year, & variable costs per unit are $10. The company plans khổng lồ produce 300,000 units next year.Assuming that fixed and variable costs per unit remain constant, what is the expected total cost of production next year?

Answer:The relevant values are as follows:

Fixed costs: a = $500,000Variable cost per unit: B = $10Production/output: x = 300,000 units
These values shown are substituted into the simple regression equation:y (total cost) = $500,000+ ($10 per unit x 300,000 units) = $3,500,000The total cost is driven by the màn chơi of production activity as the sole independent variable. As production changes, projected total costs will increase or decrease commensurately.Example 2 for Multiple Regression:

An international not-for-profit organization finances medical research. The majority of its revenue and tư vấn comes from fundraising activities, investments, and specific grants from an initial sponsoring corporation. The organization has been in operation for over 15 years & has just finished a major fundraising sự kiện that raised $500 million for the current fiscal period.

The following are selected data from recent financial statements (in millions of dollars).

Current Year

Past Year

Revenue

$500

$425

Investments(average balances)

210

185

Investment income

16

20

Administrative expense

10

8

A financial analyst wants khổng lồ determine whether the change in investment income during the current year was due to lớn changes in investment strategy, changes in portfolio mix, or other factors.Require: Which one of the following techniques should be used?A. Ratio analysis that compares changes in the investment portfolio monthly.B. Multiple regression analysis that includes independent variables associated with the nature of the investment portfolio & market conditions.C. Best-practice analysis that compares the investment income as a percentage of total assets with a competitor"s investment income as a percentage of total assets.D. Simple linear regression that compares investment income changes over the past five years khổng lồ determine the nature of the changes.Answer:Choice "B" is correct. A critical component of financial analysis is examining results over time lớn see where changes have occurred, và then develop an understanding of the drivers behind those changes.Merely looking at the numbers rarely tells the story; therefore, a more detailed analysis is needed to lớn provide context to the numbers và to help others understand the underlying drivers of change. Multiple linear regression is a statistical method used to model the relationship between one dependent (or response) variable and two or more independent (or explanatory) variables by developing a linear equation based on observed data. The purpose of doing so is to understand what independent factors are impacting the performance of the dependent variable.Applying a multiple regression analysis here should allow the analyst to lớn ascertain if the investment strategy, portfolio mix, or some other factor is the primary contributor to lớn the change in investment income.