Requirement Specification Document Of NSC Open Source Project. Hadoop A Molecular Docking Simulation System based on Hadoop Platform

Size: px

Start display at page:

Download "Requirement Specification Document Of NSC Open Source Project. Hadoop A Molecular Docking Simulation System based on Hadoop Platform"

Quentin Williamson
10 years ago
Views:

1 Requirement Specification Document Of NSC Open Source Project Hadoop A Molecular Docking Simulation System based on Hadoop Platform E Department of Medical Informatics National Science Council, Taiwan 2010/11/23

based on Hadoop Platform 101-2221-E-320-007 Department

2 (Contents) 1 (Introduction) 1.1 System) (Purpose) (Identification) (Overview) (Controlling Documents) (Document) (Purpose) (Acceptance Criteria) (Notation Description) (Priority Definition) Hadoop 2.1 (System Description) (Interface Requirements) (Internal Interface Requirements) (External Interface Requirements) (User Interfaces Requirements) (Function Requirements) (Performance Requirements) (Test Requirements) (System Test Requirement) (Acceptance Criteria) (Other Requirements) (Reliability Requirement) (Delivery Requirement) (Installation Requirement) (Environment Requirement) (Operational Concept) (Scenario 1) (Design and Implementation Constrains) (Technological Limitations) (End User Issues) (Risk Management)...11

..8 2.2.3 (User Interfaces Requirements)...9 2.3 (Function Requirements)...9 2.4 (Performance Requirements)...9 2.5 (Test Requirements)...9 2.5.1 (System Test Requirement)...9 2.5.2 (Acceptance Criteria).

3 1 (Introduction) 1.1 (System) (Purpose) Hadoop Hadoop MaReduce HDFS(Hadoop File System) Autodock[1] (Genetic Algorithm GA)[2] Hadoop MapReduce 1

4 1.1.2 (Identification) Hadoop (A Molecular Docking Simulation System based on Hadoop Platform, MDSH) (Overview) Hadoop Hadoop MapReduce HDFS Hadoop (Controlling Documents) MDSH Capability Maturity Model-Integrated v1.2 (CMMI v1.2; ) 2

1.3 (Overview) Hadoop Hadoop MapReduce HDFS Hadoop 1.1.4

5 1.2 (Document) (Purpose) MDSH (Acceptance Criteria) (Clearly and properly stated) (Completely) (Consistently) (Uniquely Identified) (Appropriately implement) (Verifiably) (Notation Description) Notation Description MDSH The MDSH system will be labeled with the number MDSH-F-xx MDSH-N-xx MDSH (Functional Requirements) MDSH (Non-Functional Requirements) (Priority Definition) No Name Description 1 Critical 2 Important 3

3 (Notation Description) Notation Description MDSH 1.0.

6 3 Desirable 4 Unnecessary 4

7 2 Hadoop (MDSH 1.0.0) 2.1 (System Description) (Molecular Docking) (ligand) (receptor) Fisher E.[3] complementarity pre-organization (EX: ) 1958 Koshland[4] induced fit ( ) (

8 3 UCSF Kuntz DOCK (anchor and grow) Autodock (Genetic Algorithm GA) Hadoop Hadoop MapReduce HDFS HDFS (NameNode) (DataNode) MapReduce JobTracker TaskTracker JobTracker TaskTracker TaskTracker TaskTracker JobTracker JobTracker MapReduce map reduce key/value Hadoop MapReduce Hadoop 1. Autodock pdbqt 2. (1) pdbqt 6

HDFS (NameNode) (DataNode) MapReduce JobTracker TaskTracker JobTracker

9 (2) GA (3) (4) (X Y Z) (5) (2) (4) 3. GA Map Reduce MapReuce Hadoop 2009 [5] MapReducing SGAs(MapReducing Compact Genetic Algorithms) GA Hadoop MapReduce GA Hadoop 2009 [6] [5] GA Hadoop [5] HDFS I/O [6] map GA Map GA Map Map GA 2 4 Reduce Reduce Map map key 7

10 [5][6] GA (Interface Requirements) (Internal Interface Requirements) MDSH-N HDFS MDSH-N Hadoop MapReduce MDSH-N Hadoop MapReduce MDSH-N Autodock pdbqt (External Interface Requirements) MDSH-N MDSH-N

Requirements) MDSH-N-001 1 HDFS MDSH-N-002 1 Hadoop MapReduce

11 2.2.3 (User Interfaces Requirements) MDSH-N (Function Requirements) MDSH-F MDSH-F MDSH-F Map Reduce Function MDSH-F GA 2.4 (Performance Requirements) MDSH-N MDSH-N (Test Requirements) (System Test Requirement) MDSH-N MDSH-N MDSH-N MDSH-N (Acceptance Criteria) MDSH-N MDSH-N (Other Requirements) (Reliability Requirement) MDSH-N MDSH-N

4 (Performance Requirements) MDSH-N-012 2 MDSH-N-013 2 5

12 2.6.2 (Delivery Requirement) MDSH-N Hadoop MDSH-N MDSH-N /06/ (Installation Requirement) MDSH-N Linux Hadoop MDSH-N java (Environment Requirement) MDSH-N ASUS RS-100 ubuntu MDSH-N CISCO Gigabit 2.7 (Operational Concept) (Scenario 1) 1. Autodock pdbqt 2. (.,,, ) 3. hadoop 4. 10

10 MDSH-N-028 1 CISCO Gigabit 2.7 (Operational Concept) 2.7.1 (Scenario 1) 1.

13 2.8 (Design and Implementation Constrains) MDSH-N java 7 MDSH-N clinet Server 2.9 (Technological Limitations) MDSH-N docking 2.10 (End User Issues) MDSH-N MDSH-N (Risk Management) MDSH-N Subversion MDSH-N

9 (Technological Limitations) MDSH-N-031 1 docking 2.

14 Reference 1. Autodock 2. J. H. Holland, Adaptation in natural and artificial systems : an introductory analysis with applications to biology, control, and artificial intelligence. Ann Arbor: University of Michigan Press, E. Fischer, "Einfluss der Configuration auf die Wirkung der Enzyme," Berichte der deutschen chemischen Gesellschaft, vol. 27, pp , D. E. Koshland, "Application of a Theory of Enzyme Specificity to Protein Synthesis," Proceedings of the National Academy of Sciences of the United States of America, vol. 44, pp , Feb D. Keco and A. Subasi, "Parallelization of genetic algorithms using Hadoop Map/Reduce," Southeast Europe Journal of Soft Computing, A. Verma, X. Llor, D. E. Goldberg, and R. H. Campbell, "Scaling Genetic Algorithms Using MapReduce," presented at the Proceedings of the 2009 Ninth International Conference on Intelligent Systems Design and Applications,

E. Fischer, "Einfluss der Configuration auf die Wirkung der En

Hadoop Architecture. Part 1

Hadoop Architecture. Part 1 Hadoop Architecture Part 1 Node, Rack and Cluster: A node is simply a computer, typically non-enterprise, commodity hardware for nodes that contain data. Consider we have Node 1.Then we can add more nodes,