Eigenvalues là gì

  -  
Eigenvectors và eigenvalues ​ ​ sống ở TT của nghành nghề dịch vụ khoa học dữ liệu. Bài viết này sẽ nhằm mục đích lý giải eigenvectors và eigenvalues ​ ​ là gì, cách chúng được thống kê giám sát và cách tất cả chúng ta hoàn toàn có thể sử dụng chúng. Đó là một chủ đề cần biết cho bất kể ai muốn hiểu sâu về máy học .Eigenvalues ​ ​ và eigenvectors tạo nên những kiến ​ ​ thức cơ bản của máy tính và toán học. Chúng được sử dụng nhiều bởi những nhà khoa học .Cấu trúc bài viết

Bài viết này được cấu trúc thành sáu phần :

Tôi sẽ bắt đầu bằng cách giới thiệu ngắn gọn về các eigenvectors và eigenvalues.Sau đó, tôi sẽ minh họa các trường hợp sử dụng và ứng dụng của chúng.Sau đó, tôi sẽ giải thích các khối xây dựng tạo nên giá trị riêng và giá trị riêng, chẳng hạn như kiến ​​thức cơ bản về phép cộng và phép nhân ma trận để chúng ta có thể làm mới kiến ​​thức và hiểu các khái niệm một cách thấu đáo.Sau đó, tôi sẽ minh họa cách tính toán riêng và giá trị riêng.Sau đó, một ví dụ làm việc về cách tính các eigenvectors và eigenvalues ​​sẽ được trình bày.Cuối cùng, tôi sẽ phác thảo cách chúng ta có thể tính toán các eigenvectors và eigenvalues ​​trong Python.

Bạn đang xem: Eigenvalues là gì

Trước khi đi sâu vào tính toán các eigenvectors và eigenvalue, chúng ta hãy hiểu chúng thực sự là gì.


Bạn đang đọc: Eigenvalues ​​và Eigenvectors là gì?


Hãy coi rằng tất cả chúng ta muốn thiết kế xây dựng những quy mô toán học ( phương trình ) trong đó tài liệu nguồn vào được tích lũy từ một số lượng lớn những nguồn. Ví dụ, giả sử rằng tất cả chúng ta muốn dự báo một biến số kinh tế tài chính phức tạp, ví dụ điển hình như hành vi của lãi suất vay theo thời hạn. Hãy xem lãi suất vay là y .

Bước đầu tiên có thể liên quan đến việc tìm các biến mà y phụ thuộc vào. Hãy gọi các biến này là x (i)

Chúng tôi sẽ bắt đầu nghiên cứu của mình bằng cách thu thập dữ liệu cho các biến mà y phụ thuộc vào. Một số dữ liệu có thể ở định dạng văn bản. Nhiệm vụ sẽ là chuyển đổi dữ liệu không phải số thành dữ liệu số. Ví dụ, chúng tôi thường sử dụng mã hóa một nóng để chuyển đổi các giá trị trong các tính năng văn bản thành các cột số riêng biệt. Nếu dữ liệu đầu vào của chúng ta ở định dạng hình ảnh thì bằng cách nào đó chúng ta sẽ phải chuyển đổi hình ảnh thành ma trận số.

Bước thứ hai là nối tài liệu vào một định dạng bảng trong đó mỗi cột của bảng được tính bằng 1 hoặc nhiều tính năng. Điều này sẽ dẫn đến một ma trận ( bảng ) thưa thớt lớn. Đôi khi, nó hoàn toàn có thể tăng khoảng trống thứ nguyên của chúng tôi lên hơn 100 cột .Bây giờ tất cả chúng ta hãy hiểu điều này !Nó đưa ra những tập hợp những yếu tố của riêng mình, ví dụ điển hình như ma trận thưa thớt lớn hoàn toàn có thể chiếm một lượng lớn dung tích trên đĩa. Thêm vào đó, việc quy mô tự đào tạo và giảng dạy về tài liệu trở nên cực kỳ tốn thời hạn. Hơn nữa, rất khó để hiểu và trực quan hóa dữ liệu có nhiều hơn 3 thứ nguyên, chưa nói đến một tập dữ liệu có hơn 100 thứ nguyên. Do đó, sẽ là lý tưởng nếu bằng cách nào đó nén / quy đổi tài liệu này thành một tập tài liệu nhỏ hơn .Có một giải pháp. Chúng ta hoàn toàn có thể sử dụng Eigenvalues ​ ​ và Eigenvectors để giảm khoảng trống thứ nguyên. Nói một cách cụ thể, một trong những phương pháp luận quan trọng để nâng cao hiệu suất cao trong những trách nhiệm thống kê giám sát sâu xa là giảm kích cỡ sau khi bảo vệ hầu hết những thông tin quan trọng được duy trì .Eigenvalues ​ ​ và Eigenvectors là những công cụ chính để sử dụng trong những trường hợp đó

1.1 Eigenvector là gì?

Tôi muốn lý giải khái niệm này theo cách mà tất cả chúng ta hoàn toàn có thể dễ hiểu .Để đơn thuần, tất cả chúng ta hãy coi rằng tất cả chúng ta đang sống trong một quốc tế hai chiều .

Ngôi nhà của Alex nằm ở tọa độ <10,10> (x = 10 và y = 10). Hãy gọi nó là vectơ A.Hơn nữa, bạn của anh ta là Bob sống trong một ngôi nhà có tọa độ <20,20> (x = 20 và y = 20). Tôi sẽ gọi nó là vector B.

Chúng ta hoàn toàn có thể thấy rằng vectơ A với B có tương quan với nhau vì vectơ B hoàn toàn có thể đạt được bằng cách nhân ( nhân ) vectơ A với 2. Điều này là do 2 x < 10,10 > = < 20,20 >. Đây là địa chỉ của Bob. Vectơ C cũng đại diện thay mặt cho hoạt động từ A đến B .Chìa khóa cần chú ý quan tâm là một vectơ hoàn toàn có thể chứa độ lớn và hướng của một hoạt động. Càng xa càng tốt !Chúng tôi đã học được từ phần trình làng ở trên rằng tập hợp tài liệu lớn hoàn toàn có thể được màn biểu diễn dưới dạng ma trận và chúng tôi cần bằng cách nào đó nén những cột của ma trận thưa thớt để tăng vận tốc giám sát của chúng tôi. Cộng với nếu tất cả chúng ta nhân một ma trận với một vectơ thì tất cả chúng ta sẽ đạt được một vectơ mới. Phép nhân ma trận với một vectơ được gọi là ma trận biến hóa .Chúng ta hoàn toàn có thể biến hóa và đổi khác ma trận thành vectơ mới bằng cách nhân ma trận với một vectơ. Phép nhân ma trận với một vectơ sẽ tính ra một vectơ mới. Đây là vector được đổi khác. Giữ tâm lý đó ngay giờ đây !Vectơ mới hoàn toàn có thể được coi là ở hai dạng :

Đôi khi, vectơ được biến đổi mới chỉ là dạng thu nhỏ của vectơ ban đầu. Điều này có nghĩa là vectơ mới có thể được tính toán lại bằng cách nhân một (số) vô hướng với vectơ ban đầu; giống như trong ví dụ về vector A và B ở trên.Và những lần khác, vectơ được biến đổi không có mối quan hệ vô hướng trực tiếp với vectơ ban đầu mà chúng ta đã sử dụng để nhân với ma trận.

Do đó, nếu nguồn vào của tất cả chúng ta là một ma trận thưa thớt lớn M thì tất cả chúng ta hoàn toàn có thể tìm thấy một vectơ o hoàn toàn có thể sửa chữa thay thế cho ma trận M. Tiêu chí là tích của ma trận M và vectơ o phải là tích của vectơ o và một vô hướng n :M * o = n * oĐiều này có nghĩa là ma trận M và một vectơ o hoàn toàn có thể được sửa chữa thay thế bằng một vô hướng n và một vectơ o .

Xem thêm: Top Game Hay Không Cần Mạng Cho Người Chơi Hệ Di Động, Tải Game Không Cần Mạng Vẫn Chơi Được

Trong trường hợp này, o là eigenvector và n là eigenvalue và mục tiêu của chúng ta là tìm o và n.

Do đó, một eigenvector là một vectơ không biến hóa khi một phép đổi khác được vận dụng cho nó, ngoại trừ việc nó trở thành một phiên bản thu nhỏ của vectơ khởi đầu .Eigenvectors hoàn toàn có thể giúp tất cả chúng ta giám sát gần đúng ma trận lớn dưới dạng vectơ nhỏ hơn. Còn rất nhiều cách sử dụng khác mà tôi sẽ lý giải ở phần sau của bài viết .Eigenvectors được sử dụng để làm cho phép biến hóa tuyến tính hoàn toàn có thể hiểu được. Hãy nghĩ về những eigenvectors như lê dài / nén biểu đồ đường XY mà không đổi khác hướng của chúng .

1.2 Eigenvalue là gì?

Eigenvalue – Đại lượng vô hướng được sử dụng để biến đổi (kéo dài) một Eigenvector.

Hãy hiểu nơi sử dụng eigenvalues ​ ​ và eigenvectors

2. Eigenvectors và Eigenvalues ​​được sử dụng ở đâu?

Có nhiều cách sử dụng eigenvalues ​ ​ và eigenvectors :

Eigenvalues ​​và Eigenvectors có tầm quan trọng của chúng trong phương trình vi phân tuyến tính khi bạn muốn tìm tốc độ thay đổi hoặc khi bạn muốn duy trì mối quan hệ giữa hai biến.

2. Chúng ta hoàn toàn có thể trình diễn một tập hợp thông tin lớn trong một ma trận. Thực hiện những phép tính trên một ma trận lớn là một quy trình rất chậm. Nói một cách chi tiết cụ thể, một trong những phương pháp luận quan trọng để nâng cao hiệu suất cao trong những trách nhiệm giám sát sâu xa là giảm size sau khi bảo vệ hầu hết những thông tin quan trọng được duy trì. Do đó, một eigenvalue và eigenvector được sử dụng để tích lũy thông tin chính được tàng trữ trong một ma trận lớn. Kỹ thuật này cũng hoàn toàn có thể được sử dụng để cải tổ hiệu suất của những thành phần trộn lẫn tài liệu .

3. Phân tích thành phần là một trong những chiến lược quan trọng được sử dụng để giảm không gian thứ nguyên mà không làm mất thông tin có giá trị. Cốt lõi của phân tích thành phần (PCA) được xây dựng dựa trên khái niệm về giá trị riêng và thiết bị định vị. Khái niệm này xoay quanh các giá trị riêng của tính toán và giá trị riêng của ma trận hiệp phương sai của các đối tượng địa lý.

Xem thêm: Sự Khác Biệt Giữa Năng Lượng Ion Hóa Là Gì ? Định Nghĩa Năng Lượng Ion Hóa Là Gì

4. Ngoài ra, eigenvectors và eigenvalues ​ ​ được sử dụng trong những kỹ thuật nhận dạng khuôn mặt như EigenFaces .5. Chúng được sử dụng để giảm khoảng trống size. Kỹ thuật Eigenvectors và Eigenvalues ​ ​ được sử dụng để nén tài liệu. Như đã đề cập ở trên, nhiều thuật toán như PCA dựa vào giá trị riêng và thiết bị xác định để giảm size .6. Eigenvalues ​ ​ cũng được sử dụng trong chính quy hóa và chúng hoàn toàn có thể được sử dụng để ngăn ngừa việc trang bị quá mức .Eigenvector và eigenvalues ​ ​ được sử dụng để giảm nhiễu trong tài liệu. Chúng hoàn toàn có thể giúp chúng tôi cải tổ hiệu suất cao trong những tác vụ yên cầu nhiều thống kê giám sát. Chúng cũng vô hiệu những tính năng có mối đối sánh tương quan ngặt nghèo giữa chúng và cũng giúp giảm thực trạng lắp quá mức .6. Thỉnh thoảng chúng tôi thu thập dữ liệu có chứa một lượng lớn nhiễu. Việc tìm kiếm những mẫu quan trọng hoặc có ý nghĩa trong tài liệu hoàn toàn có thể cực kỳ khó khăn vất vả. Eigenvector và eigenvalue hoàn toàn có thể được sử dụng để thiết kế xây dựng phân cụm quang phổ. Chúng cũng được sử dụng trong nghiên cứu và phân tích giá trị số ít .7. Chúng ta cũng hoàn toàn có thể sử dụng eigenvector để xếp hạng những mục trong tập dữ liệu. Chúng được sử dụng nhiều trong những công cụ tìm kiếm và giải tích .8. Cuối cùng, trong động lực học hoạt động phi tuyến tính, những giá trị riêng và giá trị riêng hoàn toàn có thể được sử dụng để giúp tất cả chúng ta hiểu tài liệu tốt hơn vì chúng hoàn toàn có thể được sử dụng để biến hóa và trình diễn tài liệu thành những tập hợp hoàn toàn có thể quản trị được .Phải nói rằng, hoàn toàn có thể chậm để giám sát riêng và giá trị riêng. Phép tính là O ( n³ )

*

Ảnh của Helloquence trên Unsplash

Bây giờ rõ ràng rằng Eigenvalues ​ ​ và Eigenvectors là một trong những khái niệm cốt lõi cần hiểu trong khoa học dữ liệu. Do đó bài viết này là dành riêng cho họ .Hãy xem bài viết này nếu bạn muốn hiểu về giảm thứ nguyên và PCA :Giảm thứ nguyên trong khoa học dữ liệu là gì?

*

Ảnh của Joel Filipe trên Unsplash

3. Các khối xây dựng của Eigenvalues ​​và Eigenvectors là gì?

Giảm thứ nguyên trong khoa học dữ liệu là gì ?Chúng ta hãy hiểu nền tảng của Eigenvalues ​ ​ và Eigenvectors .Eigenvectors và eigenvalues ​ ​ xoay quanh khái niệm ma trận .Ma trận được sử dụng trong những bài toán học máy để trình diễn một tập hợp thông tin lớn. Eigenvalues ​ ​ và eigenvectors đều xoay quanh việc kiến thiết xây dựng một vectơ với một giá trị để màn biểu diễn một ma trận lớn. Nghe rất có ích, phải không ?

Ma trận là gì?

Ma trận có kích thước gồm X hàng và Y cột, giống như một bảng.Ma trận vuông là ma trận có kích thước là n, ngụ ý rằng X và Y bằng nhau.Ma trận vuông được biểu diễn dưới dạng A. Đây là một ví dụ về ma trận vuông

*

3.1 Phép cộng ma trận

Phép cộng ma trận hoàn toàn có thể đạt được đơn thuần bằng cách lấy từng thành phần của ma trận và cộng chúng lại với nhau như hình dưới đây :
*

3.2 Nhân vô hướng với ma trận

Nhân Ma trận với một đại lượng vô hướng cũng giống như nhân từng thành phần với một đại lượng vô hướng :

*

3.3 Phép nhân ma trận

Phép nhân ma trận đạt được bằng cách nhân và sau đó tổng những thành phần tương thích của hai ma trận. Hình ảnh dưới đây minh họa cách tất cả chúng ta có thể nhân ma trận 3 x 3 và 3 x 1 với nhau :

*
Đó là tổng thể những môn Toán mà tất cả chúng ta cần biết lúc này

4. Tính toán Eigenvectors và Eigenvalues

Mặc dù tất cả chúng ta không nhất thiết phải đo lường và thống kê những Eigenvalues ​ ​ và Eigenvectors bằng tay mọi lúc nhưng điều quan trọng là phải hiểu được hoạt động giải trí bên trong để hoàn toàn có thể tự tin sử dụng những thuật toán .

4.1 Hãy hiểu các bước trước

Các khái niệm chính: Chúng ta hãy xem xét các gạch đầu dòng sau trước khi chúng tôi tính toán các Eigenvalues ​​và Eigenvectors

Eigenvalues ​​và Eigenvectors có các thành phần sau: