Not logged in.

Contribution Details

Type Dissertation
Scope Discipline-based scholarship
Title Automatic verification of small molecule structure with one dimensional proton nuclear magnetic resonance sprectrum
Organization Unit
Authors
  • Jiwen Li
Supervisors
  • Abraham Bernstein
  • Kim Baldridge
Institution University of Zurich
Faculty Faculty of Economics, Business Administration and Information Technology
Date January 2010
Abstract Text Small molecule structure one dimensional (1D) proton (1H) Nuclear Magnetic Resonance (NMR) verification has become a vital procedure for drug design and discovery. However, the inefficient throughput of human verification procedure has limited its application only to an arbitral instrument for molecular structural identification. Considering NMR’s unimpeachable advantages in molecular structural identification tasks (compared to other techniques), to popularize NMR technology into routine molecular structural verification procedures (especially in compound library management of the pharmaceutical industry), will dramatically increase the efficiency of drug discovery procedures. As a result, some automatic NMR structure verification software approaches were developed, described in the literature and are commercially available. Unfortunately, all of them are limited in principal (e.g. they heavily depend on the chemical shift prediction) and are shown not to be working in practice. Driven by the strong motivation from the industry, we propose a new approach as an alternative to approach the problem. Specifically, we propose to utilize approaches from artificial intelligence (AI) to mimic the spectroscopist’s NMR molecular structure verification procedure. Guided by this strategy, a human-logic based optimization (i.e. heuristic search) approach is designed to mimic the spectroscopist’s decision process. The approach is based on a probabilistic model that is used to unify the human logic based optimization approach under maximum likelihood framework. Furthermore, a new automatic 1D 1H NMR molecular structural verification system is designed and implemented based on the optimization approach proposed earlier. In order to convince vast NMR spectroscopists and molecular structural identification participators, comprehensive experiments are used to evaluate the system’s decision accuracy and consistency to the spectroscopists. The results of the experiments demonstrate that the system has very high performance in terms of both accuracy and consistency with the spectroscopists on the test datasets we used. This result validates both the correctness of our approach and the feasibility of building industrialized software based on our system to be used in practical industrial structural verification environments. As a result, commercial software based on our system is under development by a major NMR manufacture, and is going to be released to the pharmaceutical industry. Finally, the thesis also discusses similarities and differences between the human logic based optimization and other typically used optimization approaches, and especially focuses on their applicability. Through these discussions, we hope that the human logic based optimization could be used as a reference by other practical computer science participants to solve other automation problems from different domains.
Zusammenfassung Die Verifikation von kleinen eindimensionalen molekularen Protonstrukturen mittels NMR (Nuclear Magnetic Resonance) ist eine zentrale Methode fu?r die Entdeckung und Entwicklung von Medikamenten geworden. Der manuelle Verifikationsprozess ist jedoch ineffizient, womit diese Methode sich auf ein Entscheidungsinstrument fu?r die Identifikation von molekularen Strukturen beschränkt. Betrachtet man die unbestreitbaren Vorteile von NMR in der Identifikation von molekularen Strukturen (verglichen mit anderen Techniken), liegt auf der Hand, dass die Verbreitung dieser Technologie als routinemässige Verifikationsmethode fu?r molekulare Strukturen die Entwicklung von Medikamenten erheblich effizienter machen kann, insbesondere im Compound Library Management der pharmazeutischen Industrie. Dementsprechend wurde Software fu?r die automatisierte NMR Structure Verification entwickelt, in der Literatur beschrieben sowie kommerziell vertrieben. Leider sind diese Ansätze grundsätzlich limitiert (und hängen beispielweise stark von der Chemical Shift Prediction ab) und sind in der Praxis nicht einsetzbar. Angesichts der hohen Motivation durch die Industrie schlagen wir einen alternativen Ansatz fu?r das vorliegende Problem vor. Wir schlagen vor, Prinzipien der Ku?nstlichen Intelligenz (AI) zu nutzen, um das Vorgehen eine Spektroskopisten in der NMR Moleku?lstruktur-Verfikation zu simulieren. Geleitet durch diese Strategie wird ein auf menschlicher Logik basierender Optimierungsansatz entwickelt, um den Entscheidungsprozess des Spektoskopisten zu simulieren. Der Ansatz basiert auf einem Wahrscheinlichkeitsmodell, das benutzt wird, um den auf menschlicher Logik basierenden Optimierungsansatz mit dem Maximum Likelihood Framework zu vereinigen. Desweiteren wird ein neues System fu?r die 1D 1H NMR Verifikation molekularer Strukturen entwickelt und auf dem vorgängig erwähnten Optimierungsprozess implementiert. Um die zahlreichen NMR Spektroskopisten und andere am Prozess interessierte zu u?berzeugen, werden umfassende Experimente präsentiert, die aufzeigen, dass das System eine sehr hohe Leistung sowohl in der Genauigkeit wie auch in der Konsistenz im Vergleich mit Spektroskopisten in den genutzten Test Sets hat. Dieses Resultat validiert die Korrektheit unseres Ansatzes sowie die Machbarkeit, industrielle Software basierend auf unserem System zu bauen fu?r den praktischen Einsatz in industriellen Strukturverifikationsumgebungen. Dementsprechend ist kommerzielle Software, die auf unserem System basiert in der Entwicklung in einem bedeutenden NMR Hersteller, welche in der pharmazeutischen Industrie released werden wird. Abschliessend diskutiert diese Arbeit Ähnlichkeiten und Unterschiede zwischen der Optimierung basierend auf menschlicher Logik und anderen verbreiteten Optimierungsansätzen mit einem speziellen Fokus auf der Anwendbarkeit. Wir hoffen dass durch diese Diskussionen die Optimierung basierend auf menschlicher Logik als Referenz fu?r andere praxisorientierte Informatiker fu?r die Lösung anderer Automationsprobleme in anderen Gebieten genutzt wird.
PDF File Download
Export BibTeX
EP3 XML (ZORA)