Especializado en:
- Modelos gráficos probabilísticos
- Modelado predictivo
- Investigación clínica
Biografía
Recibí mi título de médico de la Universidad Médica de China en 2010 con un enfoque en oncología y un doctorado en Bioestadística de la Universidad de Buffalo en 2018. Mi interés de investigación a largo plazo es la investigación clínica, los modelos gráficos probabilísticos, la integración de datos basados en redes y el modelado predictivo. Desde que me uní a Roswell Park en septiembre de 2018, he participado en múltiples ensayos clínicos de Fase I y II y he trabajado en el Comité de Monitoreo de Seguridad de Datos. Utilizando enfoques basados en redes y multiómicos, he contribuido a múltiples estudios sobre la elucidación de los cambios genómicos y metabólicos bajo exposiciones ambientales o intervenciones terapéuticas. Además, tengo experiencia en la aplicación de técnicas de aprendizaje automático en la investigación biomédica. Al combinar redes biológicas y técnicas de aprendizaje automático, mi modelo para la predicción de la abundancia de proteínas en cánceres de ovario y de mama es uno de los modelos de mayor rendimiento en el desafío computacional de proteogenómica NCI-CPTAC DREAM. Me invitaron a unirme a un esfuerzo colaborativo y ser coautor de un artículo de descripción general sobre esta competencia.
puestos de trabajo
Centro de cáncer integral de Roswell Park
- Profesor adjunto de Oncología
- Codirector del Recurso Compartido de Bioestadística y Genómica Estadística
- Departamento de Bioestadística y Bioinformática
Fondo
Educación y Entrenamiento
- 2018 - Doctorado - Bioestadística, Facultad de Salud Pública y Profesiones de la Salud, Universidad Estatal de Nueva York en Buffalo
- 2016 - Maestría en Bioestadística, Facultad de Salud Pública y Profesiones de la Salud, Universidad Estatal de Nueva York en Buffalo
- 2013 – Maestría en Neurociencia, Universidad Estatal de Nueva York en Buffalo
- 2010 - Licenciatura en Medicina y Maestría en Medicina, Universidad Médica de China, China
Membresías profesionales
- Asociación Americana de Estadística
Resumen de la investigación
Muchos sistemas biológicos pueden describirse como redes. Actualmente, mi investigación se centra en el desarrollo de métodos estadísticos que puedan analizar eficazmente las redes biológicas. Propusimos un enfoque de detección de módulos basado en atributos y lo aplicamos a las vías de señalización celular y a las redes de interacción proteína-proteína con datos de expresión génica en pacientes con cáncer de mama. Se ha demostrado que este método es eficaz para identificar grupos de genes funcionales responsables del resultado clínico de los pacientes. Actualmente, mi atención se centra en la integración de la información de la red en el modelado predictivo. Mi segundo enfoque de investigación es la red bayesiana, en la que los bordes dirigidos codifican las independencias condicionales entre variables. Las redes bayesianas son representaciones gráficas de relaciones complejas entre variables y se pueden utilizar para responder consultas probabilísticas y se aplican ampliamente para facilitar la toma de decisiones y la predicción de los efectos de las perturbaciones en las redes. El paquete R BayesNetBP que desarrollé es un software de código abierto que admite el razonamiento probabilístico en redes bayesianas gaussianas condicionales.
Publicaciones
- Yu, H., Moharil, J. y Blair, RH (2020). BayesNetBP: un paquete R para razonamiento probabilístico en redes bayesianas. Revista de software estadístico, 94 (3), 1 – 31.
- Yang, M., Petralia, F., Li, Z., Li, H. y Ma, W., Song, X, Kim, S., Lee, H., yu, h., Lee, B., Bae, S., Heo, E., Kaczmarczyk, J., Stępniak, P., Warchol, M., Yu, T., Calinawan, AP., Boutros, PC., Payne, SH., y Reva, B., Consorcio NCI-CPTAC-DREAM, Boja, E., y Rodríguez, H., Stolovitzky, G., Guan, Y., Kang, J., Wang, P., Fenyo, D., y Saez-Rodríguez, J. (2020). Evaluación comunitaria de la predictibilidad de los niveles de proteínas y fosfoproteínas del cáncer a partir de la genómica y la transcriptómica. Sistemas celulares. https://doi.org/10.1016/j.cels.2020.06.013.
- Yo, H., & Blair, RH (2019). Integración de redes reguladoras probabilísticas en modelos de metabolismo basados en restricciones con aplicaciones a la enfermedad de Alzheimer. BMC Bioinformática, 20 (1), 386.
- Yo, H., Chapman, B., Di Florio, A., Eishen, E., Gotz, D., Jacob, M. y Blair, RH (2019). Estimaciones bootstrap de estabilidad para clústeres, observaciones y selección de modelos. Estadística computacional. 34 (1), 349-372.
- yu, h. & Blair, RH (2016). Un marco para la detección de comunidades basada en atributos con aplicaciones a la genómica funcional integrada. Simposio del Pacífico sobre Bioinformática, 21, 69 80-.