Spécialisé en:
- Modèles graphiques probabilistes
- Modélisation prédictive
- Recherche clinique
Biographie
J'ai obtenu mon diplôme de médecine à la China Medical University en 2010 avec une spécialisation en oncologie et mon doctorat en biostatistique à l'Université de Buffalo en 2018. Mes intérêts de recherche à long terme sont la recherche clinique, les modèles graphiques probabilistes, l'intégration de données en réseau et la modélisation prédictive. Depuis que j'ai rejoint Roswell Park en septembre 2018, j'ai participé à plusieurs essais cliniques de phase I et II et siégé au comité de surveillance de la sécurité des données. En utilisant des approches basées sur les réseaux et multi-omiques, j'ai contribué à de nombreuses études sur l'élucidation des changements génomiques et métaboliques sous l'effet d'expositions environnementales ou d'interventions thérapeutiques. De plus, j'ai de l'expérience dans l'application des techniques d'apprentissage automatique à la recherche biomédicale. En combinant les réseaux biologiques et les techniques d'apprentissage automatique, mon modèle de prédiction de l'abondance des protéines dans les cancers de l'ovaire et du sein est l'un des modèles les plus performants du défi informatique de protéogénomique NCI-CPTAC DREAM. J'ai été invité à me joindre à un effort de collaboration et à co-écrire un article de synthèse sur ce concours.
Positions
Centre de lutte contre le cancer de Roswell Park
- Professeur adjoint d'oncologie
- Codirecteur, Ressources partagées en biostatistique et génomique statistique
- Département de Biostatistique et Bioinformatique
Présentation
Éducation et formation
- 2018 - Doctorat - Biostatistique, École de santé publique et des professions de la santé, Université d'État de New York à Buffalo
- 2016 - MA - Biostatistique, École de santé publique et des professions de la santé, Université d'État de New York à Buffalo
- 2013 – MS – Neurosciences, Université d’État de New York à Buffalo
- 2010 - MBBS & MS - Médecine, Université médicale de Chine, Chine
Membres professionnels
- American Statistical Association
Aperçu de la recherche
De nombreux systèmes biologiques peuvent être décrits comme des réseaux. Le développement de méthodes statistiques permettant d'analyser efficacement les réseaux biologiques est actuellement l'objet de mes recherches. Nous avons proposé une approche de détection de modules basée sur les attributs et l'avons appliquée aux voies de signalisation cellulaire et aux réseaux d'interactions protéine-protéine avec des données d'expression génétique chez des patients atteints de cancer du sein. Cette méthode s'est avérée efficace pour identifier les groupes de gènes fonctionnels responsables de l'issue clinique des patients. Actuellement, je me concentre sur l'intégration des informations de réseau dans la modélisation prédictive. Mon deuxième axe de recherche est le réseau bayésien, dans lequel les arêtes dirigées codent les indépendances conditionnelles entre les variables. Les réseaux bayésiens sont des représentations graphiques de relations complexes entre variables et peuvent être utilisés pour répondre à des requêtes probabilistes et sont largement appliqués pour faciliter la prise de décision et la prédiction des effets des perturbations dans les réseaux. Le package R BayesNetBP que j'ai développé est un logiciel open source qui prend en charge le raisonnement probabiliste dans les réseaux bayésiens gaussiens conditionnels.
Publications
- Yu, H., Moharil, J. & Blair, RH (2020). BayesNetBP : un package R pour le raisonnement probabiliste dans les réseaux bayésiens. Journal des logiciels statistiques, 94 (3), 1 – 31.
- Yang, M., Petralia, F., Li, Z., Li, H. et Ma, W., Song, X, Kim, S., Lee, H., You, H., Lee, B., Bae, S., Heo, E., Kaczmarczyk, J., Stępniak, P., Warchol, M., Yu, T., Calinawan, AP., Boutros, PC., Payne, SH., et Reva, B., NCI-CPTAC-DREAM Consortium, Boja, E., et Rodriguez, H., Stolovitzky, G., Guan, Y., Kang, J., Wang, P., Fenyo, D., et Saez-Rodriguez, J. (2020). Évaluation communautaire de la prévisibilité des niveaux de protéines et de phosphoprotéines cancéreuses à partir de la génomique et de la transcriptomique. Systèmes cellulaires. https://doi.org/10.1016/j.cels.2020.06.013.
- Yu, H, & Blair, RH (2019). Intégration de réseaux de régulation probabilistes dans des modèles de métabolisme basés sur les contraintes avec des applications à la maladie d'Alzheimer. Bioinformatique BMC, 20 (1), 386.
- Yu, HChapman, B., Di Florio, A., Eishen, E., Gotz, D., Jacob, M. et Blair, RH (2019). Estimations par bootstrapping de la stabilité pour les clusters, les observations et la sélection de modèles. Statistiques computationnelles. 34 (1), 349-372.
- You, H. & Blair, RH (2016). Un cadre pour la détection de communautés basée sur les attributs avec des applications à la génomique fonctionnelle intégrée. Symposium du Pacifique sur la bioinformatique, 21, 69-80.