ชีวประวัติ ลักษณะเฉพาะ การวิเคราะห์

ฟังก์ชัน Mutual และ autocorrelation ของสัญญาณ

ฟังก์ชันความสัมพันธ์อัตโนมัติ(ACF) กำหนดลักษณะระดับของความสัมพันธ์ระหว่างค่าการสังเกตส่วนบุคคลที่นำเสนอเป็นกระบวนการสุ่มและอยู่ห่างจากกัน

ในความสัมพันธ์กับข้อมูลธรณีฟิสิกส์ ACF แสดงถึงลักษณะของความสัมพันธ์ระหว่างค่าฟิลด์ที่แยกจากกันโดย - ไม่ต่อเนื่องเช่น ไม่ต่อเนื่องโดย xหรือโดย t. ACF เป็นฟังก์ชันของการโต้แย้ง หรือ โดยที่ขั้นตอนตามโปรไฟล์คือขั้นตอนตามรอยคลื่นไหวสะเทือน เช่น .

ACF คำนวณโดยสูตร:

(4.1)

ค่าของฟิลด์อยู่ที่ไหนใน ผม- จุดนั้นของโปรไฟล์ (เส้นทาง, บ่อน้ำ); คือจำนวนจุดสังเกต เป็นช่วงเวลาที่รับค่าต่อเนื่องกันซึ่งแสดงระยะห่างระหว่างค่าของฟิลด์ และ ; - ค่าเฉลี่ยของฟิลด์ตามโปรไฟล์ เส้นทาง ฯลฯ

สำหรับ =1 ผลรวมในนิพจน์ 4.1 คือผลรวมของผลิตภัณฑ์ที่อยู่กึ่งกลาง ค่าฟิลด์ของจุดโปรไฟล์ที่อยู่ติดกัน:

ที่นี่ นั่นคือค่าของฟิลด์ที่มีศูนย์กลางอยู่ที่ ผม- รั้วโปรไฟล์ th;

สำหรับ =2 ผลรวมในนิพจน์ 4.1 คือผลรวมของผลิตภัณฑ์ของค่าฟิลด์ที่อยู่กึ่งกลางที่แยกออกจากกัน:

สำหรับใคร ม= k , (k เรามี:

โดยการก่อสร้าง ACF เป็นฟังก์ชันที่สม่ำเสมอ กล่าวคือ . เนื่องจากความเท่าเทียมกัน โดยปกติแล้ว ACF จะถูกคำนวณสำหรับ .

สำหรับ ค่า ACF เป็นการประมาณค่าความแปรปรวนของเขตข้อมูลที่ศึกษา สำหรับ ACF จะแสดงความสัมพันธ์ระหว่างค่าเขตข้อมูลสำหรับรั้วข้างเคียง (ไม่ต่อเนื่อง) และแสดงค่าประมาณของค่าสัมประสิทธิ์สหสัมพันธ์สำหรับค่าเหล่านี้ สำหรับ ACF เป็นการแสดงความสัมพันธ์ระหว่างค่าของฟิลด์ที่คั่นด้วยสองส่วนแยกกัน เป็นต้น d.

ในทางปฏิบัติมักใช้ค่าปกติของฟังก์ชันความสัมพันธ์อัตโนมัติ อาร์ น. (ม.). ในกรณีนี้ การทำให้เป็นมาตรฐานจะดำเนินการบน อาร์(0):

(4.5)

สามารถแสดงให้เห็นว่าการประมาณค่าปกติของฟังก์ชันความสัมพันธ์อัตโนมัติด้วยขนาดตัวอย่างที่เพียงพอ (จำนวนจุดบนโปรไฟล์) มีดังต่อไปนี้ คุณสมบัติ :

3. ฟังก์ชันความสัมพันธ์อัตโนมัติจะเท่ากัน นั่นคือ R n (ม.)= ร.น. (-m) ดังนั้น เมื่อทำการประเมินฟังก์ชันความสัมพันธ์อัตโนมัติ พวกมันมักจะจำกัดอยู่ที่ค่าของมันสำหรับค่าที่ไม่เป็นลบของอาร์กิวเมนต์ m>=0

4. กระบวนการสุ่มสองกระบวนการ F 1 =(f 1 , f 2 ,…..f n ) และ F 2 =(kf 1 , kf 2 ,…..kf n ) ต่างกันเพียงปัจจัยคงที่ k มีชนิดเดียวกันของ ฟังก์ชันความสัมพันธ์อัตโนมัติที่ทำให้เป็นมาตรฐาน R n (m)

5. กระบวนการสุ่มสองกระบวนการ F 1 =(f 1 , f 2 ,…..f n ) และ F 2 =(f 1 +k, f 2 +k,…..f n +k) เลื่อนสัมพันธ์กันโดยค่าคงที่ ค่า k มีรูปแบบเดียวกันของฟังก์ชันความสัมพันธ์อัตโนมัติที่ทำให้เป็นมาตรฐาน R n (m)

การวิเคราะห์นิพจน์ 4.1 และ 4.5 ​​เราสามารถสรุปได้ว่าค่าปกติของฟังก์ชันความสัมพันธ์อัตโนมัติ อาร์ น. (ม.)ไม่มีอะไรมากไปกว่าค่าสัมประสิทธิ์สหสัมพันธ์ที่คำนวณหาจุดที่ห่างไกลจากกันโดย รั้ว ดังนั้นค่าของฟังก์ชันสหสัมพันธ์สำหรับอาร์กิวเมนต์เฉพาะ แสดงว่าค่าของสนามแยกจากกันโดย ซี่งมีความสัมพันธ์ซึ่งกันและกัน ดังนั้นถ้า R(5)=0.85แสดงว่าค่าของสนามซึ่งห่างกัน 5 ซี่ โดยทั่วไปแล้วค่อนข้างสัมพันธ์กันถ้า R(9)=0.05จากนั้นค่าของฟิลด์ที่ถูกลบโดย 9 ซี่นั้นเป็นอิสระในทางปฏิบัติ (ไม่สัมพันธ์กัน) สุดท้าย เช่น ถ้า R(13)=-0.9มีความสัมพันธ์แบบผกผันอย่างมากระหว่างค่าฟิลด์ที่แยกจากกัน 13 ซี่ กระบวนการสุ่มซึ่งถึงแม้จะมีอคติเพียงครั้งเดียวก็ตาม อาร์(1)<=0 , ได้ชื่อว่า กระบวนการที่ไม่มีความสัมพันธ์โดยสิ้นเชิง ("เสียงสีขาว") .



รูปที่ 4.1 แสดงตัวอย่างการคำนวณฟังก์ชัน autocorrelation ที่ทำให้เป็นมาตรฐานสำหรับกระบวนการสุ่มต่างๆ ที่อยู่ในรูปของค่าคงที่ (1), ไซนัสอยด์ (2), กระบวนการที่ไม่มีความสัมพันธ์โดยสิ้นเชิง (3), กำลังสอง (4) และเส้นตรง (5) การทำงาน. จากรูปที่สองพบว่าฟังก์ชัน autocorrelation ของกระบวนการเป็นระยะก็เป็นระยะเช่นกัน ในกรณีนี้ ระยะเวลาของฟังก์ชันความสัมพันธ์อัตโนมัติจะตรงกับช่วงเวลาของกระบวนการ สำหรับสัญญาณที่ไม่สัมพันธ์กันโดยสิ้นเชิง ค่าของฟังก์ชันความสัมพันธ์อัตโนมัติจะใกล้ศูนย์สำหรับค่าที่ไม่เป็นศูนย์ของอาร์กิวเมนต์

ค่าปกติของฟังก์ชันความสัมพันธ์อัตโนมัติของกระบวนการคงที่มีค่าเท่ากับหนึ่งเท่ากันเนื่องจากสำหรับอคติใด ๆ ค่าของกระบวนการสุ่มตรงกันอย่างสมบูรณ์นั่นคือมีความสัมพันธ์กันโดยสิ้นเชิง

ACF กำหนดแอตทริบิวต์ที่สำคัญเช่นช่วงสหสัมพันธ์ ภายใต้ ช่วงเวลา หรือ รัศมีสหสัมพันธ์ เข้าใจระยะห่างระหว่างค่าของฟิลด์ดังกล่าว rโดยเริ่มจากค่าของสนามและถือได้ว่าไม่มีความสัมพันธ์กันและอยู่ภายใต้กฎการแจกแจงแบบปกติ - เป็นอิสระจากกัน มีการใช้เทคนิคฮิวริสติกต่างๆ ในการประมาณช่วงสหสัมพันธ์ เทคนิคที่พบบ่อยที่สุดคือการประมาณค่าของ r จากค่าที่กำหนด โดยที่ . โดยที่ rถูกนำมาเท่ากับอาร์กิวเมนต์ ACF โดยเริ่มจากความสัมพันธ์ที่เติมเต็ม

ในการประมาณช่วงสหสัมพันธ์ ยังใช้ความสัมพันธ์ต่อไปนี้:

หรือ .

ในทางปฏิบัติรัศมีสหสัมพันธ์ถูกประเมินโดยค่าต่ำสุดของอาร์กิวเมนต์ เมตรซึ่งฟังก์ชัน autocorrelation ข้ามแกน x เป็นครั้งแรก

รูปร่างของ ACF และช่วงความสัมพันธ์ถูกใช้ในการแก้ปัญหาต่างๆ ของการประมวลผลข้อมูลธรณีฟิสิกส์ ซึ่งเราเน้นสิ่งต่อไปนี้:

1) การประเมินคุณสมบัติสหสัมพันธ์ของสัญญาณและสัญญาณรบกวน หากไม่มีความสัมพันธ์ระหว่างสัญญาณกับสัญญาณรบกวน การปรากฏตัวของสัญญาณไม่ได้ขึ้นอยู่กับการรบกวน ACF จะแสดงด้วยผลรวมของ ACF ของสัญญาณและ ACF ของสัญญาณรบกวนเนื่องจาก:

จากนิพจน์นี้ที่ความเข้มของสัญญาณรบกวนต่ำเมื่อเทียบกับความเข้มของสัญญาณ ACF แสดงถึงการประมาณคุณสมบัติความสัมพันธ์ของสัญญาณ และในทางกลับกัน ในช่วงเวลาที่ไม่มีสัญญาณ ACF จะประมาณคุณสมบัติของ เสียงรบกวน;

2) ACF ของสัญญาณและสัญญาณรบกวนเป็นพื้นฐานสำหรับการคำนวณตัวกรองที่ดีที่สุดทั้งหมดที่กล่าวถึงในบทที่ 7

3) หากรูปร่างสัญญาณและรูปร่าง ACF ของการรบกวนตรงกัน จะไม่มีการประมวลผลเพิ่มเติมเพื่อแยกสิ่งใหม่ เนื่องจากในกรณีนี้ช่วงความถี่ของสัญญาณและการรบกวนจะทับซ้อนกันอย่างสมบูรณ์

4) แบ่งพื้นที่ที่เป็นเนื้อเดียวกันทางสถิติเพื่อวัตถุประสงค์ในการทำแผนที่ทางธรณีวิทยา เพื่อจุดประสงค์นี้ ค่าเฉลี่ย ความแปรปรวน และช่วงสหสัมพันธ์ ซึ่งคำนวณในหน้าต่างบานเลื่อน มักจะใช้พร้อมกัน

5) การประเมินความละเอียดของบันทึกแผ่นดินไหวตามค่าอัตราส่วน , ที่ไหน ตู่- ระยะเวลาการบันทึก ที่ ชมใกล้สามัคคีมีมติสูงด้วย ชม 0.5 ปอนด์ - ต่ำ;

6) การใช้ช่วงสหสัมพันธ์เพื่อประเมินความลึกของเหตุการณ์ ชม.วัตถุตามเขตข้อมูลที่อาจเกิดขึ้น

เกี่ยวกับความสัมพันธ์ที่เรียบง่ายนี้ระหว่างความลึก ชม.และช่วงสหสัมพันธ์ rดำเนินการอย่างแน่นอนสำหรับวัตถุในรูปแบบของกระบอกสูบที่ยืดไม่สิ้นสุดวิธีการโน้มถ่วงที่เสนอโดย A.M. Petrishchevsky และสหสัมพันธ์ที่เสนอโดย A.V. Petrov การตรวจสอบสนามที่มีศักยภาพเป็นพื้นฐาน

7) การประเมินระยะเวลาของการดำเนินการ เช่น ความยาวของโปรไฟล์ที่คำนวณ ACF ในกรณีทั่วไป การกระจายตัวของ ACF ถูกกำหนดโดยนิพจน์ ซึ่งเป็นไปตามความเป็นไปได้ของการประมาณระยะเวลาของการดำเนินการเอง .

3.2. ค้นหาค่าเฉลี่ยของชุดข้อมูลและค่าเบี่ยงเบนมาตรฐาน s เสื้อ พล็อตบนกราฟ:

3.3. ค้นหาค่าสัมประสิทธิ์สหสัมพันธ์อัตโนมัติสำหรับความล่าช้า τ = 1;2

วิธีการแก้. เราจะทำการคำนวณตามสูตร

สำหรับ τ = 1 และค่าของเรา สูตรจะมีรูปแบบดังนี้:


14
12
10
8
6 st = 3.69
4
st = 3.69
2
ตู่
1 2 3 4 5 6 7

รูปที่ 4.1 - กระบวนการสุ่มแบบไม่คงที่ของการเติบโตของรายได้

ดูตารางที่ 4.2 สำหรับการคำนวณขั้นกลางทั้งหมด ในที่สุด:

ในทำนองเดียวกันสำหรับ r(2) ดูตารางที่ 4.3:

ตาราง 4.2 - แล็ก τ = 1

t ญ(ท) y(t+τ) y(t)-(=5.72) y(t+τ)- (y(t)- ) (y(t+τ)- ) (y(t)- ) 2
1 2 3 -3,72 -2,72 10,12 13,84
2 3 4 -2,72 -1,72 4,68 7,40
3 4 5 -1,72 -0,72 1,24 2,96
4 5 5 -0,72 -0,72 0,52 0,52
5 5 7 -0,72 1,28 -0,92 0,52
6 7 14 1,28 8,28 10,60 1,64
7 - - - - - 68,56
26 38 - - 26,23 95,43

3.4. สร้างฟังก์ชันความสัมพันธ์อัตโนมัติสำหรับสามจุด (0.00; 1.00), (1.00; 0.32), (2.00; 0.10)

วิธีการแก้. ดูรูปที่ 4.1.

r

รูปที่ 4.1 ฟังก์ชั่น Autocorrelation สำหรับกระบวนการสุ่ม

หมายเหตุ: จุดที่ 4 และ 5 เป็นทางเลือก

ตาราง 4.3 - แล็ก τ = 2

t ญ(ท) y(t+τ) y(t)-(=5.72) y(t+τ)- (y(t)- ) (y(t+τ)- ) (y(t)- ) 2
1 2 4 -3,72 -1,72 6,40 13,84
2 3 5 -2,72 -0,72 1,96 7,40
3 4 5 -1,72 -0,72 1,24 2,96
4 5 7 -0,72 1,28 -0,92 0,52
5 5 14 -0,72 8,28 -5,96 0,52
6 - - - - - 1,64
7 - - - - - 68,56
19 35 - - 2,71 95,43

1. มนัสกันยัน, อ.ก. แนวทางการออกแบบงานข้อความเพื่อการศึกษา (บทคัดย่อ การควบคุม งานรายวิชา เอกสารคุณสมบัติขั้นสุดท้าย) / A.G. มนัสกันยา, ยุ.ยา. นาสติน อี.เอส. ครูกลอฟ. - Kaliningrad, KSTU Publishing House, 2017. - 22 น.

2. Kremer, N.Sh. เศรษฐมิติ: ตำรา / N.Sh. เครเมอร์, บี.เอ. พุทโก. – เศรษฐมิติ: ตำราเรียน. – ม.: UNITI-DANA, 2555. – 387 น.

3. นัสติน ยู ยา เศรษฐมิติ: หนังสือเรียน pos / ยู. ยา. นัสติน. - คาลินินกราด: NOU VPO BIEF, 2004. - 82 p.

4. นัสติน ยู.ยา. เศรษฐมิติ: วิธีการ. พระราชกฤษฎีกา และการมอบหมายงานควบคุม / ยุ.ยา. นัสติน. - คาลินินกราด: FGOU VPO KSTU, 2558. - 40 น.

5. Pakhnutov, I.A. เศรษฐมิติเบื้องต้น: วิธีการศึกษา pos. / ไอ.เอ. ปัคนูตอฟ. - คาลินินกราด: FGOU VPO "KSTU", 2552. - 108 น.

6. Buravlev, A.I. เศรษฐมิติ: ตำรา / A.I. บูราฟเลฟ – ม.: บินอม. ห้องปฏิบัติการความรู้, 2555. - 164 น.

7. Utkin, V.B. เศรษฐมิติ: ตำรา / V.B. Utkin - เอ็ด 2nd - M .: Dashkov i K, 2011. - 564 p.

8. เศรษฐมิติ: ตำรา / ed. ครั้งที่สอง เอลิเซวา. –M.: Prospekt, 2554.-288 น.

9. Valentinov, V.A. เศรษฐมิติ: ตำรา / V.A. วาเลนตินอฟ - เอ็ด 2nd - M .: Dashkov i K, 2010. - 448 p.

10. แม็กนัส, ย่า. เศรษฐมิติ: หลักสูตรเบื้องต้น / Ya.R. แมกนัส, พี.เค. Katyshev, เอเอ เปเรเซตสกี้ - รุ่นที่ 8, M.: Delo, 2008. - 504 p.

11. http://window.edu.ru/resource/022/45022 Sklyarov Yu.S. เศรษฐมิติ หลักสูตรระยะสั้น: หนังสือเรียน. - เซนต์ปีเตอร์สเบิร์ก: GUAP, 2007. - 140 p.

12. http://window.edu.ru/resource/537/74537 Shanchenko, N. I. เศรษฐมิติ: การประชุมเชิงปฏิบัติการในห้องปฏิบัติการ: คู่มือการศึกษา / N. I. Shanchenko - Ulyanovsk: UlGTU, 2011. - 117 น.

13. Berndt, E.R. แนวปฏิบัติทางเศรษฐมิติ: ความคลาสสิกและความทันสมัย: ตำราเรียน / แปลจากภาษาอังกฤษ / E.R. แบร์นดท์ - ม.: UNITI-DANA, 2548. - 863 น.

ภาคผนวก A

ค่าของฟังก์ชัน Laplace


ฟังก์ชันความสัมพันธ์อัตโนมัติ- การพึ่งพาความสัมพันธ์ระหว่างฟังก์ชัน (สัญญาณ) และสำเนาที่เลื่อนไปตามขนาดของการเปลี่ยนแปลงเวลา

สำหรับสัญญาณกำหนด ฟังก์ชันความสัมพันธ์อัตโนมัติ (ACF) สัญญาณ f (t) (\displaystyle f(t))ถูกกำหนดโดยอินทิกรัล:

Ψ (τ) = ∫ − ∞ ∞ f (t) f ∗ (t − τ) d t (\displaystyle \Psi (\tau)=\int _(-\infty )^(\infty )f(t)f^ (*)(t-\tau)\mathrm (d) t) K (τ) = E ( X (t) X ∗ (t − τ) ) ) (\displaystyle K(\tau)=\mathbb (E) \(X(t)X^(*)(t-\tau) \)),

ที่ไหน E ( ) (\displaystyle \mathbb (E) \(\ \))- การคาดหมายทางคณิตศาสตร์ เครื่องหมายดอกจันหมายถึงการผันคำกริยาที่ซับซ้อน

หากฟังก์ชันเดิมเป็นฟังก์ชันแบบกำหนดระยะอย่างเคร่งครัด กราฟของฟังก์ชันความสัมพันธ์อัตโนมัติจะมีฟังก์ชันแบบกำหนดช่วงเวลาอย่างเคร่งครัดด้วย ดังนั้น จากกราฟนี้ เราสามารถตัดสินคาบของฟังก์ชันดั้งเดิมได้ และด้วยเหตุนี้ จึงเป็นลักษณะความถี่ของมัน ฟังก์ชัน autocorrelation ใช้ในการวิเคราะห์ความผันผวนที่ซับซ้อน เช่น ภาพคลื่นไฟฟ้าสมองของมนุษย์

สารานุกรม YouTube

    1 / 3

    ฟังก์ชันความสัมพันธ์อัตโนมัติ

    ความสัมพันธ์อัตโนมัติคืออะไร?

    ฟังก์ชันความสัมพันธ์อัตโนมัติบางส่วน

    คำบรรยาย

    น่าเสียดายที่ค่าสัมประสิทธิ์ของกระบวนการค่าเฉลี่ยเคลื่อนที่ถูกตีความได้ไม่ดี 2ε(t- 1) + 3ε (t- 2) หมายถึงอะไรไม่เข้าใจอย่างสมบูรณ์ และสำหรับการตีความจะใช้ฟังก์ชันความสัมพันธ์อัตโนมัติที่เรียกว่า: ρk หรือ Corr(Yt, Yt-k) - ฟังก์ชันนี้เรียกว่าฟังก์ชันความสัมพันธ์อัตโนมัติของกระบวนการ ตามความหมายของกระบวนการอยู่กับที่กับผู้เล่นแบบกระจายปกติ ρk แสดงว่าวันนี้ Y จะเปลี่ยนแปลงโดยเฉลี่ยมากเพียงใดถ้า Y k-งวดที่ผ่านมา นั่นคือ Yt-k เพิ่มขึ้น 1 ลองใช้ MA เดียวกัน (2)- กระบวนการเป็นตัวอย่าง กระบวนการค่าเฉลี่ยเคลื่อนที่ของคำสั่ง 2 เราคำนวณและตีความฟังก์ชันความสัมพันธ์อัตโนมัติในครั้งนี้ ดังนั้นเราจึงสนใจ ρk นั่นคือ Corr (ความสัมพันธ์) ระหว่างช่วงเวลา Yt และ Y k ที่ผ่านมา อันดับแรก เราจะสังเกตเห็นข้อควรพิจารณาทั่วไปบางประการเกี่ยวกับวิธีการคำนวณฟังก์ชันความสัมพันธ์อัตโนมัติสำหรับกระบวนการใดๆ ตามคำจำกัดความของความสัมพันธ์: Corr(Yt, Yt- k) มันคือ Cov(Yt, Yt- k) หารด้วยรากของผลคูณของความแปรปรวน: Var(Yt) * Var(Yt- k) อย่างไรก็ตาม เรามีกระบวนการที่ไม่หยุดนิ่ง ที่นี่เราใช้ความจริงที่ว่ากระบวนการนั้นอยู่กับที่ กล่าวคือ ความแปรปรวนของกระบวนการนั้นเหมือนกัน Var(Yt) = Var(Yt-k) ดังนั้น เนื่องจากความแปรปรวนทั้งสองนี้เท่ากัน ดังนั้นรากของพวกมันจึงเท่ากับ - หนึ่งในนั้น ใดๆ - Cov (Yt, Yt- k) ในตัวเศษยังคงเหมือนเดิม และในตัวส่วน รากของ ผลคูณของตัวเลขที่เหมือนกันสองตัวจะให้ตัวเลขตัวแรกของตัวเลขเหล่านี้ และด้วยเหตุนี้ เราจึงตกลงกันว่านี่คือ - นี่คือฟังก์ชันการแปรปรวนอัตโนมัติ - นี่คือ γk และนี่คือความแปรปรวนหรือ γ0 ดังนั้นเราจึงได้รับว่าที่จริงแล้ว ρk เป็นฟังก์ชันความสัมพันธ์อัตโนมัติ มันเป็นแค่ความแปรปรวนอัตโนมัติแบบสเกล ฉันจะจำผลลัพธ์ก่อนหน้านี้ ในแบบฝึกหัดที่แล้ว เราพบว่า γk = 14ς กำลังสอง ถ้า k = 0 นี่คือความแปรปรวน - 3ς สี่เหลี่ยมถ้า k = 1; - 2ς สี่เหลี่ยมถ้า k = 2 และ 0 สำหรับค่าขนาดใหญ่ของ k คือมากกว่าหรือเท่ากับ 3 จากสูตรทั่วไป เราจะได้ว่า ρ0 คือ γ0 บน γ0 เสมอ 1 สำหรับกระบวนการใด ๆ ดังนั้นนี่เป็นตัวบ่งชี้ที่ไม่น่าสนใจ แต่ส่วนที่เหลือน่าสนใจกว่าอยู่แล้ว ρ1 คือ γ1/γ0 ในกรณีของเรา เราจะได้ 3/14 ρ2 - นี่คือ γ2/γ0 นี่คือ - 2/14 และตามนั้น ρ3 = ρ4 =... = 0 ดังนั้นเราจึงสามารถตีความสัมประสิทธิ์เหล่านี้ได้ p1 หมายถึงอะไร? หมายความว่าถ้าเรารู้ว่า Yt-1 (Y ของเมื่อวาน) เพิ่มขึ้นหนึ่งหน่วย นี่นำไปสู่ความจริงที่ว่าโดยเฉลี่ย Yt ลดลง 3/14 เราสามารถตีความ ρ1 ได้ ดังนั้นเราจึงตีความ ρ2 ในลักษณะเดียวกัน หากทราบว่า Yt- 2 (นั่นคือค่าของ Y เมื่อวันก่อน) กลายเป็นว่ามากกว่าค่าเฉลี่ย 1 นั่นคือเพิ่มขึ้นหนึ่งหน่วยเมื่อเทียบกับค่าเฉลี่ยบางอย่างแล้ว เราสามารถสรุปได้ว่า Yt จะลดลงโดยเฉลี่ย 2/14 นี่คือวิธีที่เราตีความสัมประสิทธิ์นี้ ตามลำดับ ρ3, ρ4 และอื่นๆ ถูกตีความดังนี้ ข้อมูลเกี่ยวกับค่าของ Yt- 3 นั้นไม่มีข้อมูลใดๆ เกี่ยวกับ Yt ปัจจุบันอีกต่อไป และโดยเฉพาะอย่างยิ่งไม่มีประโยชน์ในการคาดการณ์ แต่ค่าสองค่าก่อนหน้านี้มีความสำคัญต่อเรา

การประยุกต์ใช้ในเทคโนโลยี

คุณสมบัติสหสัมพันธ์ของลำดับรหัสที่ใช้ในระบบไวด์แบนด์ขึ้นอยู่กับประเภทของลำดับรหัส ความยาว ความถี่ของสัญลักษณ์ และโครงสร้างแบบสัญลักษณ์ต่อสัญลักษณ์

การเรียน ACFมีบทบาทสำคัญในการเลือกลำดับรหัสในแง่ของความน่าจะเป็นต่ำสุดในการสร้างการซิงโครไนซ์ที่ผิดพลาด

การใช้งานอื่นๆ

ฟังก์ชันความสัมพันธ์อัตโนมัติมีบทบาทสำคัญในการสร้างแบบจำลองทางคณิตศาสตร์และการวิเคราะห์อนุกรมเวลา โดยแสดงลักษณะเวลาของกระบวนการภายใต้การศึกษา (ดู ตัวอย่าง: Turchin P. V.พลวัตทางประวัติศาสตร์ มอสโก: URSS, 2007. ISBN 978-5-382-00104-3) โดยเฉพาะอย่างยิ่ง วงจรในพฤติกรรมของระบบไดนามิกที่สอดคล้องกับสูงสุดของฟังก์ชันความสัมพันธ์อัตโนมัติของพารามิเตอร์ลักษณะเฉพาะบางอย่าง

คอมพิวเตอร์ความเร็ว

บ่อยครั้งจำเป็นต้องคำนวณฟังก์ชันความสัมพันธ์อัตโนมัติสำหรับอนุกรมเวลา x ฉัน (\displaystyle x_(i)). การคำนวณแบบตัวต่อตัวได้ผลสำหรับ O (T 2) (\displaystyle O(T^(2))). อย่างไรก็ตาม มีวิธีทำสำหรับ

สาระสำคัญของวิธีนี้มีดังนี้ คุณสามารถทำการแปลงข้อมูลแบบหนึ่งต่อหนึ่งผกผันบางประเภท ที่เรียกว่าการแปลงฟูริเยร์ ซึ่งจะทำให้พวกมันสัมพันธ์กันแบบหนึ่งต่อหนึ่งกับชุดข้อมูลในอีกพื้นที่หนึ่ง เรียกว่าสเปซความถี่ การดำเนินการกับข้อมูลในพื้นที่ปกติของเรา เช่น การบวก การคูณ และที่สำคัญที่สุดคือ ความสัมพันธ์อัตโนมัติ มีการโต้ตอบแบบหนึ่งต่อหนึ่งในพื้นที่ความถี่ฟูริเยร์ แทนที่จะคำนวณ autocorrelation "head-on" ในข้อมูลเดิมของเรา เราจะดำเนินการกับข้อมูลที่สอดคล้องกันในพื้นที่ความถี่ฟูริเยร์สเปกตรัม ซึ่งทำในเวลาเชิงเส้น O(T) - ความสัมพันธ์อัตโนมัติในพื้นที่ความถี่สอดคล้องกับ a การคูณอย่างง่าย หลังจากนั้นตามข้อมูลที่ได้รับเราจะกู้คืนข้อมูลที่เกี่ยวข้องในพื้นที่ปกติ การเปลี่ยนจากพื้นที่ธรรมดาเป็นพื้นที่ความถี่และในทางกลับกันทำได้โดยใช้การแปลงฟูริเยร์ที่รวดเร็วสำหรับ O (T บันทึก ⁡ T) (\displaystyle O(T\log T))การคำนวณแอนะล็อกของความสัมพันธ์อัตโนมัติในสเปซของความถี่คือ O(T) ดังนั้นเราจึงได้รับผลกำไรในเวลาในการคำนวณ และเป็นสัดส่วนโดยตรงกับตัวแรก n (\displaystyle n)องค์ประกอบลำดับ

Ψ (τ) ∼ Re ⁡ fft − 1 ⁡ (| fft ⁡ (x →) | 2) (\displaystyle \Psi (\tau)\sim \operatorname (Re) \operatorname (fft) ^(-1)\left (\left|\operatorname (fft) ((\vec (x)))\right|^(2)\right))

จตุรัสของโมดูลที่ซับซ้อนถูกนำองค์ประกอบโดยองค์ประกอบ: | ก → | 2 = ( Re 2 ⁡ a i + Im 2 ⁡ a i ) (\displaystyle \left|(\vec (a))\right|^(2)=\left\(\operatorname (Re) ^(2)a_(i )+\operatorname (อิม) ^(2)a_(i)\right\)). หากไม่มีข้อผิดพลาดในการคำนวณ ส่วนจินตภาพจะเป็นศูนย์ ค่าสัมประสิทธิ์สัดส่วนถูกกำหนดจากข้อกำหนด Ψ (0) = 1 (\displaystyle \Psi (0)=1).

เมื่อศึกษา ACF ของพัลส์วิดีโอสี่เหลี่ยมหนึ่งชุด ผู้อ่านก็ให้ความสนใจกับความจริงที่ว่ากราฟที่เกี่ยวข้องมีรูปร่างกลีบดอกที่เฉพาะเจาะจง จากมุมมองเชิงปฏิบัติ เมื่อคำนึงถึงการใช้ ACF เพื่อแก้ปัญหาการตรวจจับสัญญาณดังกล่าวหรือการวัดค่าพารามิเตอร์ จะไม่มีนัยสำคัญอย่างยิ่งที่กลีบแต่ละกลีบจะมีรูปทรงสามเหลี่ยม เฉพาะระดับสัมพัทธ์เมื่อเปรียบเทียบกับค่ากลางสูงสุดที่มีความสำคัญ

งานต่อไปของเราคือการเปลี่ยนคำจำกัดความของฟังก์ชันความสัมพันธ์อัตโนมัติ เพื่อให้เราสามารถดึงข้อมูลที่เป็นประโยชน์ออกมา แยกย่อยจากรายละเอียดรอง พื้นฐานสำหรับสิ่งนี้คือแนวคิดของแบบจำลองทางคณิตศาสตร์ของสัญญาณแบบไม่ต่อเนื่อง (ดูบทที่ 1)

คำอธิบายของสัญญาณที่ซับซ้อนพร้อมโครงสร้างที่ไม่ต่อเนื่อง

ชุดพัลส์วิดีโอสี่เหลี่ยมที่เหมือนกันเป็นตัวแทนที่ง่ายที่สุดของคลาสของสัญญาณที่ซับซ้อนซึ่งสร้างขึ้นตามหลักการต่อไปนี้ ช่วงเวลาทั้งหมดของการมีอยู่ของสัญญาณแบ่งออกเป็นจำนวนเต็ม M > 1 ของช่วงที่เท่ากัน เรียกว่าตำแหน่ง ในแต่ละตำแหน่ง สัญญาณสามารถอยู่ในสถานะใดสถานะหนึ่งจากสองสถานะ ซึ่งสอดคล้องกับตัวเลข +1 และ -1

ข้าว. 3.6 อธิบายวิธีการบางอย่างในการสร้างสัญญาณที่ซับซ้อนหลายตำแหน่ง เพื่อความชัดเจน ที่นี่ M = 3

จะเห็นได้ว่าลักษณะทางกายภาพของสัญญาณที่ไม่ต่อเนื่องอาจแตกต่างกัน

ข้าว. 3.6. สัญญาณเชิงซ้อนสามตำแหน่ง: a - การเข้ารหัสแอมพลิจูด; b - การเข้ารหัสเฟส

ในกรณี a สัญลักษณ์จะสอดคล้องกับค่าบวกของความสูงของพัลส์วิดีโอที่ส่งไปยังตำแหน่งที่สอดคล้องกัน อักขระ -1 สอดคล้องกับค่าลบ - ว่ากันว่ามีการใช้การเข้ารหัสแอมพลิจูดของสัญญาณที่ซับซ้อนในกรณีนี้ ในกรณี b จะเกิดการเข้ารหัสเฟส ในการส่งสัญลักษณ์ +1 ที่ตำแหน่งที่สอดคล้องกัน ส่วนของสัญญาณฮาร์มอนิกที่มีเฟสเริ่มต้นเป็นศูนย์จะถูกสร้างขึ้น ในการแสดงสัญลักษณ์ -1 จะใช้เซ็กเมนต์คลื่นไซน์ที่มีระยะเวลาและความถี่เท่ากัน แต่เฟสของมันถูกเลื่อนไปอีก 180°

แม้จะมีความแตกต่างในกราฟของสัญญาณ daukh เหล่านี้ แต่ในสาระสำคัญ เราสามารถสร้างเอกลักษณ์ที่สมบูรณ์ระหว่างพวกเขาจากมุมมองของแบบจำลองทางคณิตศาสตร์ของพวกเขา แท้จริงแล้วรูปแบบของสัญญาณดังกล่าวเป็นลำดับของตัวเลขซึ่งแต่ละสัญลักษณ์ใช้ค่าที่เป็นไปได้หนึ่งในสองค่า +1 เพื่อความสะดวก เราจะตกลงกันในอนาคตที่จะเสริมลำดับดังกล่าวด้วยศูนย์ที่ตำแหน่ง "ว่าง" ซึ่งไม่ได้กำหนดสัญญาณไว้ ในกรณีนี้ ตัวอย่างเช่น รูปแบบการขยายของการเขียนสัญญาณแบบไม่ต่อเนื่อง (1 1, -1, 1) จะมีลักษณะดังนี้

การดำเนินการที่สำคัญที่สุดในการประมวลผลสัญญาณแบบไม่ต่อเนื่องคือการเปลี่ยนสัญญาณดังกล่าวตามจำนวนตำแหน่งที่สัมพันธ์กับตำแหน่งเริ่มต้นโดยไม่มี เปลี่ยนรูปร่าง ตัวอย่างเช่น ด้านล่างนี้คือสัญญาณต้นฉบับบางส่วน (บรรทัดแรก) และสำเนา (บรรทัดต่อมา) ที่เลื่อนตำแหน่ง 1, 2 และ 3 ในทิศทางของการหน่วงเวลา:

ฟังก์ชันความสัมพันธ์อัตโนมัติแบบไม่ต่อเนื่อง

เราจะพยายามสรุปสูตร (3.15) ในลักษณะที่เป็นไปได้ที่จะคำนวณแอนะล็อกแบบไม่ต่อเนื่องของ ACF ตามที่ใช้กับสัญญาณหลายตำแหน่ง เป็นที่ชัดเจนว่าการบูรณาการที่นี่ควรแทนที่ด้วยผลรวม และแทนที่จะใช้ตัวแปร ควรใช้จำนวนเต็ม (บวกหรือลบ) เพื่อระบุจำนวนตำแหน่งที่สำเนาถูกเลื่อนเมื่อเทียบกับสัญญาณดั้งเดิม

เนื่องจากแบบจำลองทางคณิตศาสตร์ของสัญญาณมีศูนย์ในตำแหน่ง "ว่าง" เราจึงเขียน ACF แบบไม่ต่อเนื่องเป็น

ฟังก์ชันอาร์กิวเมนต์จำนวนเต็มนี้โดยธรรมชาติแล้วมีคุณสมบัติหลายอย่างที่ทราบอยู่แล้วของฟังก์ชัน autocorrelation ทั่วไป ดังนั้นจึงง่ายที่จะเห็นว่า ACF แบบไม่ต่อเนื่องนั้นเท่ากัน:

ด้วย Bullet shift ACF นี้จะกำหนดพลังงานของสัญญาณแบบไม่ต่อเนื่อง:

ตัวอย่างบางส่วน

เพื่อแสดงให้เห็นข้างต้น ลองคำนวณ ACF แบบไม่ต่อเนื่องของสัญญาณสามตำแหน่งที่มีค่าเดียวกันในแต่ละตำแหน่ง: มาเขียนสัญญาณนี้พร้อมกับสำเนาที่เลื่อน 1, 2 และ 3 ตำแหน่ง:

จะเห็นได้ว่า ณ ที่ สัญญาณและสำเนาหยุดทับกัน ดังนั้นผลคูณในสูตร (3.29) จะกลายเป็นศูนย์ที่ คำนวณผลรวมเราจะได้

กลีบด้านข้างของฟังก์ชันความสัมพันธ์อัตโนมัติลดลงเชิงเส้นตามจำนวนที่เพิ่มขึ้น และเช่นเดียวกับในกรณีของฟังก์ชันความสัมพันธ์อัตโนมัติของพัลส์วิดีโอแอนะล็อกสามพัลส์

พิจารณาสัญญาณที่ไม่ต่อเนื่องซึ่งแตกต่างจากสัญญาณก่อนหน้าในเครื่องหมายนับถอยหลังในตำแหน่งที่สอง:

ในทำนองเดียวกัน เราคำนวณค่าของฟังก์ชันความสัมพันธ์อัตโนมัติแบบไม่ต่อเนื่องสำหรับสัญญาณนี้:

จะพบว่ากลีบด้านแรกเปลี่ยนเครื่องหมายโดยที่ค่าสัมบูรณ์ไม่เปลี่ยนแปลง

สุดท้าย ให้พิจารณาสัญญาณแบบไม่ต่อเนื่องสามตำแหน่งด้วยแบบจำลองทางคณิตศาสตร์ของฟอร์ม

ฟังก์ชันความสัมพันธ์อัตโนมัติของมันคือ:

จากสัญญาณที่ไม่ต่อเนื่องสามสัญญาณที่ศึกษาที่นี่ สัญญาณที่สามที่สมบูรณ์แบบที่สุดในแง่ของคุณสมบัติสหสัมพันธ์ เนื่องจากระดับต่ำสุดของกลีบด้านข้างของฟังก์ชันสหสัมพันธ์อัตโนมัติถูกรับรู้ในกรณีนี้

สัญญาณของบาร์คเกอร์

สัญญาณที่ไม่ต่อเนื่องที่มีโครงสร้างที่ดีที่สุดของฟังก์ชันความสัมพันธ์อัตโนมัติคือในปี 1950 และ 1960 ซึ่งเป็นเป้าหมายของการวิจัยอย่างเข้มข้นโดยผู้เชี่ยวชาญในสาขาวิศวกรรมวิทยุทฤษฎีและคณิตศาสตร์ประยุกต์ พบทั้งคลาสของสัญญาณที่มีคุณสมบัติสหสัมพันธ์ที่สมบูรณ์แบบ ในหมู่พวกเขาสัญญาณที่เรียกว่า Barker (รหัส) ได้รับความนิยมอย่างมาก สัญญาณเหล่านี้มีคุณสมบัติเฉพาะ: โดยไม่คำนึงถึงตำแหน่งหมายเลข M ค่าของฟังก์ชันความสัมพันธ์อัตโนมัติที่คำนวณโดยสูตร (3.29) จะไม่เกินความสามัคคีสำหรับทุกคน ในเวลาเดียวกัน พลังงานของสัญญาณเหล่านี้ กล่าวคือ ค่าเป็นตัวเลขเท่ากับ M

สัญญาณของบาร์คเกอร์สามารถรับรู้ได้ก็ต่อเมื่อจำนวนตำแหน่ง M = 2, 3, 4, 5, 7, 11 และ 13 เท่านั้น กรณีนี้ไม่สำคัญ สัญญาณ Barker at ถูกตรวจสอบโดยเราเมื่อสิ้นสุดส่วนก่อนหน้า แบบจำลองทางคณิตศาสตร์ของสัญญาณ Barker และฟังก์ชันความสัมพันธ์อัตโนมัติที่เกี่ยวข้องแสดงไว้ในตาราง 3.2.

ตารางที่ 3.2 โมเดลสัญญาณ Barker

สำหรับภาพประกอบในรูป 3.7 แสดงมุมมองของสัญญาณ Barker 13 ตำแหน่งที่ใช้บ่อยที่สุดพร้อมวิธีการเข้ารหัสสองวิธี เช่นเดียวกับการแสดงกราฟิกของ ACF

ข้าว. 3.7. สัญญาณ Barker ที่ M = 13: a - การเข้ารหัสแอมพลิจูด; b - การเข้ารหัสเฟส c - ฟังก์ชันความสัมพันธ์อัตโนมัติ

โดยสรุป เราสังเกตว่าการศึกษาคุณสมบัติบางอย่างของสัญญาณแบบไม่ต่อเนื่องและฟังก์ชันสหสัมพันธ์อัตโนมัติ ซึ่งดำเนินการในบทนี้มีลักษณะเบื้องต้นและเบื้องต้น การศึกษาอย่างเป็นระบบของคำถามช่วงนี้จะดำเนินการในบทที่ สิบห้า

ฟังก์ชันความสัมพันธ์อัตโนมัติ คอร์เรโลแกรม

หากมีแนวโน้มและการเปลี่ยนแปลงวัฏจักรในอนุกรมเวลา ค่าของระดับถัดไปของอนุกรมจะขึ้นอยู่กับค่าก่อนหน้า ความสัมพันธ์ระหว่างระดับต่อเนื่องของอนุกรมเวลาเรียกว่าความสัมพันธ์อัตโนมัติของระดับของอนุกรมเวลา

สามารถวัดในเชิงปริมาณได้โดยใช้ดัชนีความสัมพันธ์ระหว่างระดับของอนุกรมเวลาดั้งเดิมและระดับของอนุกรมนี้ โดยเปลี่ยนตามช่วงเวลาหลายขั้นตอน

ให้อนุกรมเวลา: คุณ คุณ ... uและให้มีความสัมพันธ์เชิงเส้นตรงระหว่าง y tและ y t -1.

หาค่าสัมประสิทธิ์สหสัมพันธ์ระหว่างอนุกรม ที่ tและ ที่ เสื้อ -1 .

ในการทำเช่นนี้ เราใช้สูตรต่อไปนี้:

ลาด x j = y t -1 , y j = y t -1 ,เราได้รับ

(5.1)

ค่าสัมประสิทธิ์สหสัมพันธ์อัตโนมัติของคำสั่งที่สองและสูงกว่าจะถูกกำหนดในทำนองเดียวกัน ดังนั้น ค่าสัมประสิทธิ์สหสัมพันธ์ลำดับที่ 2 จึงกำหนดลักษณะความใกล้ชิดของความสัมพันธ์ระหว่างระดับต่างๆ ที่และ ที่และถูกกำหนดโดยสูตร:

(5.2)

ลำดับของระดับของอนุกรมความสัมพันธ์อัตโนมัติเรียกว่าความล่าช้า

สำหรับสูตร (5.1) ความล่าช้าจะเท่ากับหนึ่ง สำหรับ (5.3) จะเท่ากับสอง

ลำดับของสัมประสิทธิ์สหสัมพันธ์อัตโนมัติของระดับที่หนึ่ง สอง ฯลฯ คำสั่งเรียกว่าฟังก์ชันความสัมพันธ์อัตโนมัติของอนุกรมเวลา (ACF)

กราฟของการพึ่งพาค่าของมันตามขนาดของความล่าช้าเรียกว่าคอร์เรโลแกรม

ACF และคอร์เรโลแกรมทำให้สามารถระบุความล่าช้าที่ความสัมพันธ์อัตโนมัตินั้นสูงที่สุด และด้วยเหตุนี้ ความล่าช้าที่ความสัมพันธ์ระหว่างระดับปัจจุบันและก่อนหน้าของชุดข้อมูลนั้นใกล้เคียงที่สุด กล่าวคือ สามารถใช้เพื่อเปิดเผยโครงสร้างของซีรีส์ได้

ขอแนะนำให้ใช้ค่าสัมประสิทธิ์สหสัมพันธ์อัตโนมัติและ ACF เพื่อระบุการมีอยู่หรือไม่มีขององค์ประกอบแนวโน้มและองค์ประกอบแบบวนในอนุกรมเวลา:

หากค่าสัมประสิทธิ์สหสัมพันธ์อัตโนมัติของลำดับที่ 1 มีค่าสูงสุด แสดงว่าชุดข้อมูลที่อยู่ระหว่างการศึกษามีเพียงแนวโน้มเท่านั้น

ถ้าค่าสัมประสิทธิ์ความสัมพันธ์อัตโนมัติของลำดับที่ k กลายเป็นค่าสูงสุด แสดงว่าอนุกรมนั้นมีการผันผวนแบบวัฏจักรโดยมีคาบเป็น k จุดเวลา

หากไม่มีสัมประสิทธิ์ใดที่มีนัยสำคัญ ก็สามารถสันนิษฐานหนึ่งในสองข้อเกี่ยวกับโครงสร้างของอนุกรมนี้: อนุกรมนั้นไม่มีแนวโน้มและการเปลี่ยนแปลงวัฏจักร และมีโครงสร้างคล้ายกับโครงสร้างของอนุกรมที่แสดงในรูปที่ 5.1c หรือชุดข้อมูลมีแนวโน้มที่ไม่เป็นเชิงเส้นที่แข็งแกร่ง ซึ่งต้องมีการวิเคราะห์เพิ่มเติมเพื่อระบุ

49. แบบจำลองการถดถอยทั่วไป วิธีทั่วไปของกำลังสองน้อยที่สุด ทฤษฎีบทของ Aitken

เมื่อสร้างแบบจำลอง เช่น มุมมองเชิงเส้น

Y \u003d a + b 1 * x 1 + b 2 * x 2 + ... + b p * x p + ε (59.1)

ตัวแปรสุ่ม  เป็นตัวแปรที่ไม่สามารถสังเกตได้ สำหรับข้อมูลจำเพาะของรุ่นที่แตกต่างกัน ความแตกต่างระหว่างค่าตามทฤษฎีและค่าจริงอาจแตกต่างกันไป งานของการวิเคราะห์การถดถอยไม่เพียงรวมถึงการสร้างตัวแบบเท่านั้น แต่ยังรวมถึงการศึกษาการเบี่ยงเบนแบบสุ่ม  i.e. มูลค่าคงเหลือ หลังจากสร้างสมการถดถอย เราจะตรวจสอบว่าค่าประมาณ  i มีคุณสมบัติบางอย่างหรือไม่ คุณสมบัติเหล่านี้ของการประมาณที่ได้รับโดย OLS มีความสำคัญในทางปฏิบัติอย่างมากในการใช้ผลการถดถอยและสหสัมพันธ์

สัมประสิทธิ์การถดถอย ข ผม พบบนพื้นฐานของระบบสมการปกติและเป็นตัวแทนของการประมาณการแบบเลือกเฉพาะของคุณสมบัติของความแข็งแรงพันธะ จะต้องมีคุณสมบัติของความไม่เอนเอียง การประมาณที่ไม่เอนเอียงหมายความว่าค่าเฉลี่ยของเศษเหลือเป็นศูนย์

ซึ่งหมายความว่าพารามิเตอร์การถดถอยที่พบ ข ผม ถือได้ว่าเป็นค่าเฉลี่ยของค่าที่เป็นไปได้ของสัมประสิทธิ์การถดถอยด้วยค่าประมาณที่เป็นกลางของเศษที่เหลือ

เพื่อวัตถุประสงค์ในทางปฏิบัติ ไม่เพียงแต่ความเป็นกลางเท่านั้นที่มีความสำคัญ แต่ยังรวมถึงประสิทธิภาพของการประมาณการด้วย ค่าประมาณจะถือว่ามีผลถ้ามีค่าความแปรปรวนน้อยที่สุด

เพื่อให้ช่วงความเชื่อมั่นของพารามิเตอร์การถดถอยเป็นจริง การประมาณต้องสอดคล้องกัน ความสอดคล้องของการประมาณค่ากำหนดลักษณะการเพิ่มขึ้นของความแม่นยำด้วยการเพิ่มขนาดตัวอย่าง

การศึกษาที่เหลือ  ฉันเกี่ยวข้องกับการทดสอบการมีอยู่ของสถานที่ OLS ห้าแห่งต่อไปนี้:

ลักษณะสุ่มของสารตกค้าง

มูลค่าคงเหลือเฉลี่ยเป็นศูนย์ ไม่ขึ้นกับ x i ;

homoscedasticity - ความแปรปรวนของแต่ละส่วนเบี่ยงเบน  i จะเหมือนกันสำหรับค่า x ทั้งหมด

ไม่มีความสัมพันธ์อัตโนมัติของสารตกค้าง ค่าของส่วนที่เหลือ  ผม ถูกแจกจ่ายอย่างอิสระจากกัน

ส่วนที่เหลือเป็นไปตามการกระจายแบบปกติ

หากการกระจายของเศษตกค้างแบบสุ่ม  i ไม่สอดคล้องกับสมมติฐาน LSM บางอย่าง แบบจำลองควรได้รับการแก้ไข

ประการแรก ตรวจสอบลักษณะสุ่มของเศษเหลือ  i

หากได้รับแถบแนวนอนของการกระจายของเศษเหลือบนกราฟ เศษที่เหลือจะเป็นตัวแปรสุ่มและกำลังสองน้อยที่สุดคือเหตุผล ค่าทางทฤษฎีของ y x จะใกล้เคียงกับค่าจริงของ y

กรณีต่อไปนี้เป็นไปได้: ถ้า  ผม . ขึ้นอยู่กับ y x แล้ว:

ส่วนที่เหลือ  ผม . ไม่สุ่ม

ส่วนที่เหลือ  ผม . ไม่มีการกระจายตัวคงที่

ส่วนที่เหลือ  ผม . เป็นระบบ

ในกรณีเหล่านี้ จำเป็นต้องใช้ฟังก์ชันอื่น หรือป้อนข้อมูลเพิ่มเติมและสร้างสมการถดถอยใหม่จนกว่าเศษ  i จะเป็นตัวแปรสุ่ม

หลักฐานที่สองหมายความว่าค่าเฉลี่ยของเศษเหลือเท่ากับศูนย์:

. (59.2)

สมมติฐานที่สามของกำลังสองน้อยที่สุดต้องการให้ความแปรปรวนของเศษเหลือเป็น homoscedastic ซึ่งหมายความว่าสำหรับแต่ละค่าของแฟคเตอร์ x j เศษเหลือ  i จะมีความแปรปรวนเท่ากัน หากไม่เป็นไปตามเงื่อนไขนี้สำหรับการใช้ LSM จะเกิดความแตกต่างกัน

50. สี่เหลี่ยมจัตุรัสน้อยที่สุดทั่วไปที่เข้าถึงได้

วิธีกำลังสองน้อยที่สุดตัวแบบการถดถอยทั่วไปบางประเภทมีการกล่าวถึงในส่วนประเภทพื้นฐานของแบบจำลองไม่เชิงเส้น หลังจากเลือกแบบจำลองแล้ว คำถามก็เกิดขึ้น: จะประเมินแบบจำลองเหล่านี้ได้อย่างไร หากคุณคุ้นเคยกับวิธีการถดถอยเชิงเส้น (อธิบายไว้ในส่วนการถดถอยพหุคูณ) หรือการวิเคราะห์ความแปรปรวน (อธิบายไว้ในส่วนการวิเคราะห์ความแปรปรวน) คุณจะรู้ว่าวิธีการทั้งหมดเหล่านี้ใช้การประมาณค่ากำลังสองน้อยที่สุด ประเด็นหลักของวิธีนี้คือการลดผลรวมของการเบี่ยงเบนกำลังสองของค่าที่สังเกตได้ของตัวแปรตามจากค่าที่คาดการณ์โดยแบบจำลอง (คำว่าช่องสี่เหลี่ยมน้อยที่สุดถูกใช้ครั้งแรกโดย Legendre - Legendre, 1805)
วิธีถ่วงน้ำหนักสี่เหลี่ยมน้อยที่สุดวิธีที่ใช้บ่อยที่สุดอันดับสาม นอกเหนือจากวิธีกำลังสองน้อยที่สุดและการประมาณค่าผลรวมของค่าเบี่ยงเบนสัมบูรณ์ (ดูด้านบน) คือวิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก วิธีกำลังสองน้อยที่สุดธรรมดาถือว่าการกระจัดกระจายของเศษเหลือจะเท่ากันสำหรับค่าทั้งหมดของตัวแปรอิสระ กล่าวอีกนัยหนึ่ง ความแปรปรวนข้อผิดพลาดจะถือว่าเหมือนกันสำหรับการวัดทั้งหมด บ่อยครั้ง ข้อสันนิษฐานนี้ไม่เป็นจริง โดยเฉพาะอย่างยิ่ง จะพบความเบี่ยงเบนจากค่านี้ในธุรกิจ เศรษฐศาสตร์ การประยุกต์ใช้ทางชีววิทยา (โปรดทราบว่าการประมาณค่าพารามิเตอร์โดยใช้วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนักสามารถรับได้โดยใช้โมดูลการถดถอยพหุคูณ)



ตัวอย่างเช่น คุณต้องการศึกษาความสัมพันธ์ระหว่างต้นทุนการก่อสร้างอาคารที่คาดการณ์ไว้กับจำนวนเงินที่ใช้ไปจริง สิ่งนี้มีประโยชน์ในการรับค่าประมาณการเกินที่คาดไว้ ในกรณีนี้ สมเหตุสมผลที่จะถือว่ามูลค่าสัมบูรณ์ของต้นทุนที่เกิน (แสดงเป็นดอลลาร์) เป็นสัดส่วนกับต้นทุนของโครงการ ดังนั้น เพื่อให้พอดีกับตัวแบบการถดถอยเชิงเส้น ควรใช้วิธีกำลังสองน้อยที่สุดแบบถ่วงน้ำหนัก ฟังก์ชันการสูญเสียอาจเป็นเช่นนี้ (ดู Neter, Wasserman และ Kutner, 1985, p. 168):

การสูญเสีย = (ผู้สังเกตการณ์ทำนาย) 2 * (1/x 2)

ในสมการนี้ ส่วนแรกของฟังก์ชันการสูญเสียหมายถึงฟังก์ชันการสูญเสียกำลังสองน้อยที่สุดมาตรฐาน (สังเกตลบกำลังสองที่คาดการณ์ไว้ นั่นคือ กำลังสองของฟังก์ชันการสูญเสีย) และส่วนที่สองเท่ากับ "น้ำหนัก" ของการสูญเสียนี้ในแต่ละกรณี - หนึ่งหารด้วยกำลังสองของตัวแปรอิสระ (x) สำหรับการสังเกตแต่ละครั้ง ในสถานการณ์การประมาณค่าจริง โปรแกรมจะรวมค่าฟังก์ชันการสูญเสียจากการสังเกตทั้งหมด (เช่น โครงการออกแบบ) ตามที่อธิบายไว้ข้างต้น และเลือกพารามิเตอร์ที่ลดผลรวมให้เหลือน้อยที่สุด กลับไปที่ตัวอย่างที่พิจารณา ยิ่งโปรเจ็กต์ (x) มีขนาดใหญ่เท่าใด ข้อผิดพลาดแบบเดียวกันในการคาดการณ์ต้นทุนก็จะยิ่งน้อยลงเท่านั้น วิธีนี้ให้ค่าประมาณที่มีประสิทธิภาพมากขึ้นสำหรับพารามิเตอร์การถดถอย (ดู Neter, Wasserman และ Kutner. 1985 สำหรับรายละเอียดเพิ่มเติม)

51. เชาว์ทดสอบ

การทดสอบทางสถิติอย่างเป็นทางการสำหรับการประเมินแบบจำลองแนวโน้มอนุกรมเวลาโดยมีการเปลี่ยนแปลงโครงสร้างเสนอโดย Gregory Chow* การทดสอบนี้เกี่ยวข้องกับการคำนวณพารามิเตอร์ของสมการแนวโน้ม เราแนะนำสัญกรณ์ที่ระบุในตาราง

ตารางที่ 3 - คำอธิบายสำหรับอัลกอริธึมการทดสอบ Chow

สมมติว่าสมมติฐาน H0 ยืนยันความเสถียรทางโครงสร้างของแนวโน้มของอนุกรมเวลาที่ศึกษา ผลรวมที่เหลือของสี่เหลี่ยมจัตุรัสตามแบบจำลองเชิงเส้นแบบเป็นชิ้น (C cl ost) สามารถหาได้จากผลรวมของ C 1 rev และ C 2 rev

C cl ost \u003d C 1 ost + C 2 ost (62.1)

จำนวนองศาอิสระที่สอดคล้องกันจะเป็น:

(n 1 - k 1) + (n 2 - k 2) = n - k 1 - k 2 (62.2)

จากนั้น การลดความแปรปรวนที่เหลือระหว่างการเปลี่ยนสมการแนวโน้มแบบรวมเป็นแบบจำลองเชิงเส้นแบบทีละชิ้นจะถูกกำหนดดังนี้:

DC ส่วนที่เหลือ = C 3 ส่วนที่เหลือ - C cl ส่วนที่เหลือ (62.3)

จำนวนองศาอิสระที่สอดคล้องกับ DC โดยคำนึงถึงความสัมพันธ์ (23) จะเป็น:

n - k 3 - (n - n 1 - k 2) = k 1 + k 2 - k 3 (62.4)

จากนั้น ตาม G. Chow วิธี G. Chow ถูกใช้เพื่อค้นหาค่าที่แท้จริงของเกณฑ์ F สำหรับการกระจายตัวต่อไปนี้ต่อหนึ่งระดับของความอิสระของการแปรผัน:

(62.5)

ค่าที่พบของข้อเท็จจริง F ถูกเปรียบเทียบกับตาราง (ตารางการแจกแจงของฟิชเชอร์สำหรับระดับนัยสำคัญ α ‚ และจำนวนองศาอิสระ (k 1 + k 2 - k 3) และ (n - k 1 - k 2)

หากตาราง F ข้อเท็จจริง > F สมมติฐานเกี่ยวกับเสถียรภาพเชิงโครงสร้างของแนวโน้มถูกปฏิเสธ และผลกระทบของการเปลี่ยนแปลงเชิงโครงสร้างต่อไดนามิกของตัวบ่งชี้ที่ศึกษาจะถือว่ามีนัยสำคัญ ในกรณีนี้ การสร้างแบบจำลองแนวโน้มของอนุกรมเวลาควรทำโดยใช้แบบจำลองเชิงเส้นแบบเป็นชิ้น ถ้า

ข้อเท็จจริง< F табл то нулевая гипотеза структурной стабильности тенденции не отвергается. Ее моделирование следует осуществлять с помощью единого для всей совокупности уравнения тренда.

คุณสมบัติของแอพพลิเคชั่นการทดสอบ Chow

1. หากจำนวนพารามิเตอร์ในสมการทั้งหมดจากตารางที่ 3 (1), (2), (3) เท่ากันและเท่ากับ k สูตร (56) จะถูกลดความซับซ้อน:

(62.6)

2. การทดสอบ Chow ทำให้สามารถสรุปเกี่ยวกับการมีอยู่หรือไม่มีความเสถียรของโครงสร้างในอนุกรมเวลาที่ศึกษาได้ ถ้า F เป็นข้อเท็จจริง< F табл, то это означает, что уравнения (1) и (2) описывают одну и ту же тенденцию, а различия численных оценок их пара метров а 1 и а 2 , а также b 1 и b 2 соответственно статистически не значимы. Если же F факт >ตาราง F สมมติฐานของความเสถียรของโครงสร้างถูกปฏิเสธ ซึ่งหมายความว่าความแตกต่างในการประมาณค่าพารามิเตอร์ของสมการ (1) และ (2) มีนัยสำคัญทางสถิติ

3. การประยุกต์ใช้การทดสอบ Chow ถือว่าเป็นไปตามสมมติฐานเกี่ยวกับการแจกแจงแบบปกติของเศษเหลือในสมการ (1) และ (2) และการแจกแจงเป็นอิสระ

หากสมมติฐานเกี่ยวกับเสถียรภาพเชิงโครงสร้างของแนวโน้มของอนุกรม y ถูกปฏิเสธ การวิเคราะห์เพิ่มเติมอาจประกอบด้วยการตรวจสอบสาเหตุของความแตกต่างเชิงโครงสร้างเหล่านี้ และอีก 1 แห่งศึกษาธรรมชาติของการเปลี่ยนแปลงของแนวโน้ม ในสัญกรณ์ที่ยอมรับ เหตุผลเหล่านี้จะกำหนดความแตกต่างในการประมาณค่าพารามิเตอร์ของสมการ (1) และ (2)

การรวมกันของการเปลี่ยนแปลงต่อไปนี้ในการประมาณค่าตัวเลขของพารามิเตอร์ของสมการเหล่านี้เป็นไปได้:

การเปลี่ยนค่าประมาณเชิงตัวเลขของเงื่อนไขอิสระของสมการเทรนด์ 2เมื่อเทียบกับ a 1 โดยมีเงื่อนไขว่าความแตกต่าง ข 1และ ข2ไม่มีนัยสำคัญทางสถิติ ในเชิงเรขาคณิต นี่หมายความว่าเส้น (1) (2) ขนานกัน มีการเปลี่ยนแปลงอย่างกะทันหันในระดับของซีรีส์y t, ณ ห้วงเวลา t‚ และการเติบโตสัมบูรณ์โดยเฉลี่ยที่ไม่เปลี่ยนแปลงในช่วงเวลานั้น

การเปลี่ยนค่าประมาณตัวเลขของพารามิเตอร์ ข2เมื่อเทียบกับ ข 1โดยมีเงื่อนไขว่าความแตกต่างระหว่าง 1 และ 2 ไม่มีนัยสำคัญทางสถิติ ในเชิงเรขาคณิต นี่หมายความว่าเส้น (1) และ (2) ตัดกับแกนพิกัดที่จุดหนึ่ง การเปลี่ยนแปลงของแนวโน้มเกิดขึ้นจากการเปลี่ยนแปลงในการเพิ่มขึ้นสัมบูรณ์โดยเฉลี่ยในอนุกรมเวลา โดยเริ่มจากช่วงเวลา t' ด้วยระดับเริ่มต้นคงที่ของซีรีส์ในขณะนั้น t=0

เปลี่ยนค่าประมาณตัวเลขของพารามิเตอร์ a 1 และ 2 เช่นเดียวกับ ข 1และ ข2. ในกราฟนี้แสดงโดยการเปลี่ยนแปลงในระดับเริ่มต้นและค่าเฉลี่ยสำหรับช่วงเวลาที่เติบโตแน่นอน