¿Cuáles son algunas aplicaciones de la ciencia de datos en la ciencia de los materiales?

Minería Gráfica de Datos

Considere el siguiente escenario:

  • Tienes recursos computacionales limitados.
  • Tiene una serie de curvas de transferencia de calor producidas a partir de experimentos que requieren mucho tiempo para calcular y trazar.
  • Ha acumulado una acumulación de experimentos y curvas de transferencia de calor asociados con ellos, pero realmente desea ahorrar tiempo y dinero en lugar de calcularlos. ¿Qué puedes hacer?

Bueno, puedes hacer lo que Varde et al. lo hizo, y use algoritmos de agrupamiento para predecir las curvas de transferencia de calor de los experimentos en la ciencia de los materiales en lugar de calcularlas. Su trabajo también hace posible predecir los parámetros de un experimento necesario para producir una curva de transferencia de calor específica, por lo que es una aplicación bastante ingeniosa.

Informática de materiales; o materiales de construcción a partir de datos

Hay un campo pequeño y emergente llamado informática de materiales, probablemente mejor explicado por Krishna Rajan en su artículo en Materials Today .

Dejaré que lo explique mejor:

Cuando se combina con un enorme espacio combinatorio de químicas tal como se define incluso en una pequeña porción de la tabla periódica, se ve claramente que la búsqueda de nuevos materiales con propiedades personalizadas es una tarea prohibitiva. Por lo tanto, la búsqueda de nuevos materiales para nuevas aplicaciones se limita a conjeturas educadas. Los datos que existen a menudo se limitan a pequeñas regiones de espacio compositivo. Los datos experimentales están dispersos en la literatura, y los datos computacionalmente derivados se limitan a unos pocos sistemas para los cuales existen datos confiables para el cálculo. Incluso después de los recientes avances en la informática de alta velocidad, existen límites para la forma en que se pueden calcular la estructura y las propiedades de muchos materiales nuevos.

Entonces, ¿cómo planea abordar este problema?

El desafío es lidiar con bases de datos extremadamente grandes y dispares y computación a gran escala. Es aquí donde el descubrimiento de conocimiento en bases de datos o minería de datos, un campo interdisciplinario que combina ideas de estadísticas, aprendizaje automático, bases de datos y computación paralela y distribuida, proporciona una herramienta única para integrar información científica y teoría para el descubrimiento de materiales. El objetivo de la minería de datos es la extracción de conocimiento y conocimiento de bases de datos masivas. Toma la forma de descubrir nuevos patrones o construir modelos a partir de un conjunto de datos dado. La oportunidad es aprovechar los avances recientes en la minería de datos y aplicarlos a enfoques computacionales y experimentales de vanguardia para el descubrimiento de materiales.

O, como lo muestra este gráfico,


De hecho, robaré uno de sus ejemplos para mi próximo encabezado.

Adaptación química del procesamiento cerámico con PCA

¿Cómo evalúa los factores que controlan la resistencia a la fractura en la cerámica? Quiero decir, ¿cómo descubrirías qué es lo que hace que algunas cerámicas sean fáciles de romper y las otras no tanto?

Bueno, si eres como Krishna Rajan y su equipo, podrías usar el análisis de componentes principales en una base de datos con más de 2000 entradas y 20 conjuntos diferentes de variables latentes para determinar que los aditivos específicos de tierras raras juegan un papel importante, y que muchos Otros no lo hacen.

Izquierda: un gráfico de correlación entre diferentes aditivos en cerámica de nitruro de silicio que Rajan y su equipo consideraron, con un color que indica la relativa resistencia a la fractura de la combinación resultante. Derecha: El análisis de componentes principales se aplicó al mismo gráfico de correlación, revelando una sorprendente serie de grupos, lo que indica que son los parámetros principales detrás de la resistencia a la fractura en estas cerámicas.

Modelando el estrés de flujo usando redes neuronales artificiales

¿Sabes cuándo estás diseñando un material metálico y quieres poder obtener las propiedades de tensión de flujo correctas? Sí, yo tampoco, pero sigamos con eso.

Muchas de las propiedades interesantes y no lineales de los materiales derivan en última instancia de su microestructura. Estas propiedades no lineales dificultan el cálculo a mano, por lo que Yassar et al. decidieron que probablemente podrían entrenar un método computacional utilizando estructuras de dislocación en materiales para predecir el valor del estrés de flujo de los materiales.

Robado de su periódico, al que les he vinculado fácilmente.

Afirman excelentes resultados para la aleación de aluminio 6022, con pequeños errores porcentuales. Y quiero decir pequeño: el más alto es aproximadamente el 3%.

Y un montón más …

De Minería de datos y descubrimiento de conocimiento en ciencia e ingeniería de materiales: un estudio de caso de nanocompuestos de polímeros, encontrará la siguiente lista impresionante (plagiada, por supuesto, pero por favor no me demande):

  • Clasificación: Hu et al. [9] utilizó la informática de materiales para resolver el problema del intercambio de datos de imágenes de ciencia de materiales. Presentaron un enfoque basado en ontología que se puede utilizar para desarrollar anotaciones para datos de ciencia de materiales no estructurados con la ayuda de tecnologías web semánticas.
  • Análisis bayesiano: Sabin et al. [11] evaluó un modelo de proceso estadístico gaussiano alternativo, que infiere una distribución de probabilidad sobre todos los datos de entrenamiento y luego interpola para hacer predicciones de la evolución de la microestructura que surge de la recristalización estática en un campo de deformación no uniforme. El esfuerzo, la temperatura y el tiempo de recocido fueron las entradas del modelo y el logaritmo medio del tamaño de grano fue su salida.
  • Algoritmos evolutivos: Javadi y Rezania [12] proporcionaron un marco unificado para el modelado de materiales complejos, utilizando el modelo constitutivo basado en regresión polinómica evolutiva (EPRCM), integrado en el análisis de elementos finitos (FE), por lo que un método inteligente de elementos finitos (EPR-FEM ) se desarrolló sobre la base de la integración de las relaciones constitutivas basadas en EPR en el marco de FE. En la metodología desarrollada, el EPRCM se utilizó como alternativa a los modelos constitutivos convencionales para el material. Los resultados de los análisis se compararon con los obtenidos de los análisis convencionales de FE. Los resultados indicaron que los EPRCM pueden capturar el comportamiento constitutivo del material con una alta precisión y pueden implementarse con éxito en un modelo FE.
  • Procesamiento de imagen: Brilakis et al. [13] presentó un método de recuperación de imagen de sitio de construcción automatizado y basado en contenido basado en el reconocimiento de grupos de materiales en cada imagen. Bajo este método, los píxeles de cada imagen se agruparon en grupos significativos y posteriormente se combinaron con una variedad de muestras de material pre-clasificadas. Por lo tanto, se detectó la existencia de materiales de construcción en cada imagen y luego se utilizó con fines de recuperación de imágenes. Este método ha permitido a los ingenieros buscar de manera significativa imágenes de construcción en función de su contenido.
  • Procesamiento del lenguaje natural: Sharif Ullah y Harib [14] presentaron un método inteligente para tratar los problemas de selección de materiales, en el que las configuraciones de diseño, las condiciones de trabajo y la información relevante para el diseño no se conocen con precisión. Las entradas para este método fueron: (1) una descripción lingüística de los problemas de selección de material (expresando los niveles requeridos de propiedades / atributos del material y su importancia), y (2) los cuadros de propiedades del material relevantes para la descripción lingüística del problema. El método se aplicó para seleccionar materiales óptimos para enlaces robóticos y se descubrió que los materiales compuestos eran mejores que los materiales metálicos para enlaces robóticos.

Es sorprendente lo que cinco minutos de Google pueden traerle en estos días …

Los científicos de materiales estaban haciendo ciencia de datos antes de que fuera genial. El modelado de la estructura de banda electrónica de materiales complejos requiere realizar cientos de iteraciones de cálculos de teoría funcional de densidad computacionalmente intensiva en grupos de supercomputación. Los programas deben escribirse y optimizarse en C para que las simulaciones solo demoren una semana en finalizar, en lugar de un mes. La gran cantidad de datos que se genera debe analizarse con scripts bash a través de conexiones SSH. Averiguar qué sucede cuando comienzan a suceder cosas extrañas requiere muchas matemáticas y estadísticas inteligentes.

Para mí, lo mejor de la ciencia de datos es el hecho de que la disciplina tiene el potencial de mejorar casi todos los aspectos de la vida diaria. En ciencia de los materiales, específicamente, creo que se convertirá en un recurso invaluable. Puntos críticos de falla, interacciones potencialmente adversas, casos de uso inesperados, satisfacción general del usuario, oportunidades para mejorar; Estas cosas y muchas más se pueden identificar y estudiar en conjunto de un conjunto de datos bien organizado. Si la pregunta equivale a “¿Cómo puedo mejorar mi proceso para satisfacer mejor las necesidades de mis colegas o clientes?” La ciencia de datos proporciona el conjunto de herramientas ideal para encontrar las respuestas que necesita.