¿Qué libros de texto o materiales del curso debo revisar para las matemáticas utilizadas en Computer Vision?

Una gran cantidad de documentos de CV generalmente se basan en tecnologías existentes que se han modificado para funcionar con visión artificial. He visto artículos que utilizan ideas de campos tan diversos como el procesamiento de señales, los gráficos y la teoría de la información. No creo que podamos encontrar un libro que nos dé una idea sobre todas las herramientas matemáticas utilizadas en todos estos campos.

Pero aquí hay algunos libros / artículos que pueden ayudarlo a tener una idea de cómo ver las matemáticas en los documentos.
1. Manual de modelos matemáticos en visión artificial: Nikos Paragios, Yunmei Chen, Olivier D. Faugeras: 9780387263717: Amazon.com: Libros

2. Optimización convexa: Boyd y Vandenberghe

3. Aprendizaje automático para visión artificial

Además de esto, le sugiero que mantenga el Matrix Cookbook: Page en uci.edu a su lado cada vez que aborde cualquier problema de procesamiento de CV / señal.

Un libro apareció hace varios años, llamado “Manual de modelos matemáticos en visión artificial”. Cubre muchos aspectos, como cortes gráficos, conjuntos de niveles, etc. Eso será útil.

Como otros señalaron, también puede hacer lo siguiente: Estudiar de un libro de texto estándar de ML. Estudio sobre la optimización convexa. Estudio sobre modelos gráficos probabilísticos, son especialmente útiles en visión. Estudie algo de procesamiento de señal.

Bueno, veo que desea alcanzar la perfección en la investigación de la visión por computadora y quiere comprender la idea del documento simplemente viendo las ecuaciones matemáticas, pero este enfoque, como intenté seguir el mismo, puede no funcionar.

La visión por computadora es el campo donde la mayor parte del aprendizaje proviene del código y la visualización. Una vez que explore el código y lo entienda correctamente, esas ecuaciones comenzarán a tener sentido. Por ejemplo, tome el famoso contexto Hough Transform o Shape. Sin embargo, puede encontrar las matemáticas difíciles, si ve su implementación, entonces, de repente, las ecuaciones comenzarán a tener sentido (si ya se ha hecho eso).

Por lo tanto, le sugiero que vaya a la implementación del documento (puede encontrar fácilmente la implementación en estos días como los autores lo pusieron en su web), y tratar de tener una idea general de lo que está haciendo el código. Luego, nuevamente lea el periódico. Haz muchas de estas iteraciones.

Aún así, si descubre que no puede visualizar la idea en su mente, puede leer este libro: Visión por computadora: algoritmos y aplicaciones por Richard Szeliski

No conozco ningún libro de texto que discuta específicamente las matemáticas necesarias en la visión por computadora. En mi opinión, las matemáticas son un medio para lograr un fin en lo que respecta a la visión: te ayuda a formular tus ideas de alto nivel. Entonces, el truco es concentrarse en comprender la intuición y las ideas de alto nivel primero y luego, generalmente, las matemáticas funcionan. Un enfoque que funciona para mí es:

  • Revise el documento, obtenga una comprensión intuitiva de lo que ha hecho el autor. No te molestes si algunas de las ecuaciones no tienen sentido
  • Si encuentra un tema completamente nuevo, búsquelo, lea la página de Wikipedia o el documento introductorio sobre ese tema para comprenderlo, y luego vuelva al documento original.
  • Vuelva al papel armado con su comprensión intuitiva y resuelva las matemáticas
  • ¡No tengas miedo de hacer preguntas a amigos / maestros!

Lectura de texto estándar. La inversión inicial dará sus frutos.
Lea sobre el aprendizaje automático a partir del texto estándar. Lea Geometría de Veiw múltiple de zisserman y hartley. Lea sobre optimización e inferencia.

Cuando lea un periódico, sabrá lo que no sabe. Ahora puedes intentar aprender lo que no sabes. Funciona para mi.
No sé mucho sobre gráficos, así que no puedo comentar sobre eso.