FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE9501, 487 aa 1>>>pF1KE9501 487 - 487 aa - 487 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.4176+/-0.000976; mu= 13.0332+/- 0.058 mean_var=156.5380+/-49.929, 0's: 0 Z-trim(107.0): 235 B-trim: 1117 in 2/48 Lambda= 0.102510 statistics sampled from 8841 (9298) to 8841 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.633), E-opt: 0.2 (0.286), width: 16 Scan time: 2.650 The best scores are: opt bits E(32554) CCDS2604.1 HRH1 gene_id:3269|Hs108|chr3 ( 487) 3291 499.4 3.6e-141 CCDS10031.1 CHRM5 gene_id:1133|Hs108|chr15 ( 532) 464 81.4 2.7e-15 CCDS1616.1 CHRM3 gene_id:1131|Hs108|chr1 ( 590) 454 79.9 8.1e-15 CCDS5843.1 CHRM2 gene_id:1129|Hs108|chr7 ( 466) 452 79.5 8.5e-15 CCDS44581.1 CHRM4 gene_id:1132|Hs108|chr11 ( 479) 450 79.2 1.1e-14 CCDS8040.1 CHRM1 gene_id:1128|Hs108|chr11 ( 460) 443 78.2 2.1e-14 CCDS5006.1 HTR1E gene_id:3354|Hs108|chr6 ( 365) 428 75.9 8.5e-14 CCDS4986.1 HTR1B gene_id:3351|Hs108|chr6 ( 390) 427 75.7 9.8e-14 CCDS4292.1 ADRB2 gene_id:154|Hs108|chr5 ( 413) 412 73.5 4.8e-13 CCDS4395.1 HRH2 gene_id:3274|Hs108|chr5 ( 359) 405 72.4 8.9e-13 CCDS47344.1 HRH2 gene_id:3274|Hs108|chr5 ( 397) 405 72.5 9.5e-13 CCDS2920.1 HTR1F gene_id:3355|Hs108|chr3 ( 366) 398 71.4 1.8e-12 CCDS231.1 HTR1D gene_id:3352|Hs108|chr1 ( 377) 398 71.4 1.9e-12 CCDS34168.1 HTR1A gene_id:3350|Hs108|chr5 ( 422) 386 69.7 6.9e-12 CCDS83269.1 ADRA1A gene_id:148|Hs108|chr8 ( 342) 382 69.0 9.1e-12 CCDS7586.1 ADRB1 gene_id:153|Hs108|chr10 ( 477) 384 69.5 9.2e-12 CCDS6052.1 ADRA1A gene_id:148|Hs108|chr8 ( 429) 382 69.1 1.1e-11 CCDS6053.1 ADRA1A gene_id:148|Hs108|chr8 ( 455) 382 69.2 1.1e-11 CCDS6054.1 ADRA1A gene_id:148|Hs108|chr8 ( 466) 382 69.2 1.1e-11 CCDS34869.1 ADRA1A gene_id:148|Hs108|chr8 ( 475) 382 69.2 1.1e-11 CCDS13493.1 HRH3 gene_id:11255|Hs108|chr20 ( 445) 379 68.7 1.5e-11 CCDS13079.1 ADRA1D gene_id:146|Hs108|chr20 ( 572) 368 67.2 5.4e-11 >>CCDS2604.1 HRH1 gene_id:3269|Hs108|chr3 (487 aa) initn: 3291 init1: 3291 opt: 3291 Z-score: 2648.0 bits: 499.4 E(32554): 3.6e-141 Smith-Waterman score: 3291; 100.0% identity (100.0% similar) in 487 aa overlap (1-487:1-487) 10 20 30 40 50 60 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 VGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 VGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE9 LCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSFLWVIPILGWNHFMQQTSVRREDKC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 LCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSFLWVIPILGWNHFMQQTSVRREDKC 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE9 ETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEIKLR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 ETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEIKLR 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE9 PENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDREVDKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 PENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDREVDKL 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE9 YCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNTHGASEISEDQMLGDSQSFSR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 YCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNTHGASEISEDQMLGDSQSFSR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE9 TDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRLRSHSRQYVSGLHMNRERKAAKQLGFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 TDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRLRSHSRQYVSGLHMNRERKAAKQLGFI 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE9 MAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCNENFKKTFK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS26 MAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCNENFKKTFK 430 440 450 460 470 480 pF1KE9 RILHIRS ::::::: CCDS26 RILHIRS >>CCDS10031.1 CHRM5 gene_id:1133|Hs108|chr15 (532 aa) initn: 701 init1: 398 opt: 464 Z-score: 388.0 bits: 81.4 E(32554): 2.7e-15 Smith-Waterman score: 688; 29.0% identity (58.8% similar) in 486 aa overlap (26-486:29-513) 10 20 30 40 50 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERK ... ...: ... :.:. :.::. . . . . CCDS10 MEGDSYHNATTVNGTPVNHQPLERHRLWEVITIAAVTAVVSLITIVGNVLVMISFKVNSQ 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE9 LHTVGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFS :.::.: :..::. ::::.: : . :.::..:.:: : .::..:::::.::... CCDS10 LKTVNNYYLLSLACADLIIGIFSMNLYTTYILMGRWALGSLACDLWLALDYVASNASVMN 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE9 VFILCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPILGWNHFMQQTSVRR .... .::: :. .:: : :: ::. : ::..:: ::. :: :.... . .: CCDS10 LLVISFDRYFSITRPLTYRAKRTPKRAGIMIGLAWLISFILWAPAILCWQYLVGKRTVPL 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE9 EDKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSE :.:. .: . . ::: ::.:. .: .: .::. .... . .. : . CCDS10 -DECQIQFLSEPTITFGTAIAAFYIPVSVMTILYCRIYRETEKRTKDLADLQGSDSVTKA 190 200 210 220 230 240 250 260 270 280 pF1KE9 IKLRPEN----------PKGD-AKKPGKESPWEVLKRKPKDAGGGSVLKSPSQT-PKEMK : .: . :. :.. ... : .:. . .: : .:: . : . CCDS10 EKRKPAHRALFRSCLRCPRPTLAQRERNQASWSSSRRSTSTTGKPSQATGPSANWAKAEQ 240 250 260 270 280 290 290 300 310 320 330 340 pF1KE9 SPVVFSQEDDREVDKLYCFP-LDIVHMQAAAEGSSRDYVA--VNRSHGQLKTDEQGLNTH . : .... :: : :..:. . . :. .... : .... . .:... .: CCDS10 LTTCSSYPSSEDEDKPATDPVLQVVYKSQGKESPGEEFSAEETEETFVKAETEKSDYDTP 300 310 320 330 340 350 350 360 370 380 390 pF1KE9 G------ASEISEDQMLGDSQSFSRTDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRLR . :.. ..: . . .: . :: : :.. . . : : CCDS10 NYLLSPAAAHRPKSQKCVAYKFRLVVKADGNQETNNGCHKVKIMPCPFPVAKEPSTKGLN 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE9 ---SHSRQYVSGLHMNRERKAAKQLGFIMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMF ::. . . . .:::::. :. :. :::. : :: :. .: .:: .: : . CCDS10 PNPSHQMTKRKRVVLVKERKAAQTLSAILLAFIITWTPYNIMVLVSTFCDKCVPVTLWHL 420 430 440 450 460 470 460 470 480 pF1KE9 TIWLGYINSTLNPLIYPLCNENFKKTFKRILHIRS :: :.:::.::. : :::..:.:::: .: : CCDS10 GYWLCYVNSTVNPICYALCNRTFRKTFKMLLLCRWKKKKVEEKLYWQGNSKLP 480 490 500 510 520 530 >>CCDS1616.1 CHRM3 gene_id:1131|Hs108|chr1 (590 aa) initn: 754 init1: 412 opt: 454 Z-score: 379.5 bits: 79.9 E(32554): 8.1e-15 Smith-Waterman score: 663; 28.4% identity (58.9% similar) in 496 aa overlap (26-483:67-559) 10 20 30 40 50 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSE :.. .. . . . :::. :.::. . . . CCDS16 FGSYNVSRAAGNFSSPDGTTDDPLGGHTVWQVVFIAFLTGILALVTIIGNILVIVSFKVN 40 50 60 70 80 90 60 70 80 90 100 110 pF1KE9 RKLHTVGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASI ..:.::.: ...::. ::::.:.. : . :..:..:.:: : .::..:::::.::. CCDS16 KQLKTVNNYFLLSLACADLIIGVISMNLFTTYIIMNRWALGNLACDLWLAIDYVASNASV 100 110 120 130 140 150 120 130 140 150 160 170 pF1KE9 FSVFILCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPILGWNHFMQQTSV ...... .::: :. .:: : :: ::.. : :: .:: ::. :: :..:. . .: CCDS16 MNLLVISFDRYFSITRPLTYRAKRTTKRAGVMIGLAWVISFVLWAPAILFWQYFVGKRTV 160 170 180 190 200 210 180 190 200 210 220 pF1KE9 RREDKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQH----------R .: .: . . ::: ::.:. .: .: .::: .... .. CCDS16 P-PGECFIQFLSEPTITFGTAIAAFYMPVTIMTILYWRIYKETEKRTKELAGLQASGTEA 220 230 240 250 260 270 230 240 250 260 270 pF1KE9 ELINRSLP-----SFSEIKLRPENPK-GDAKKPGKESPWEVLKR-KPK-DAGGGSVLKSP : : : : : .:. .. : .. .: :. : . : ::. . . .: CCDS16 ETENFVHPTGSSRSCSSYELQQQSMKRSNRRKYGRCHFWFTTKSWKPSSEQMDQDHSSSD 280 290 300 310 320 330 280 290 300 310 320 330 pF1KE9 SQTPKEMKSPVVFSQEDDREVDKLYCFPLDIVHMQAAAEGSSRDYVAVNRSHG-QLKTDE : . .. . . : .:.: . . .. .... . . . : . :. .: CCDS16 SWNNNDAAASLENSASSDEEDIGSETRAIYSIVLKLPGHSTILNSTKLPSSDNLQVPEEE 340 350 360 370 380 390 340 350 360 370 380 pF1KE9 QGLNT--HGASEISEDQMLGDSQSFSRT------------DSDTTTETAPGKGKLRSGSN :. . :.... .. . :. :: .. :. :... . :: : .. CCDS16 LGMVDLERKADKLQAQKSVDDGGSFPKSFSKLPIQLESAVDTAKTSDVNSSVGK--STAT 400 410 420 430 440 450 390 400 410 420 430 pF1KE9 TGLDYIKFTW-KRLRSHSRQYVSG---LHMNRERKAAKQLGFIMAAFILCWIPYFIFFMV :.. . : ::. ..:. .. . . .:.:::. :. :. :::. : :: :. .: CCDS16 LPLSFKEATLAKRFALKTRSQITKRKRMSLVKEKKAAQTLSAILLAFIITWTPYNIMVLV 460 470 480 490 500 510 440 450 460 470 480 pF1KE9 IAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCNENFKKTFKRILHIRS .:: .: . . . :: :::::.::. : :::..:. ::: .: CCDS16 NTFCDSCIPKTFWNLGYWLCYINSTVNPVCYALCNKTFRTTFKMLLLCQCDKKKRRKQQY 520 530 540 550 560 570 CCDS16 QQRQSVIFHKRAPEQAL 580 590 >>CCDS5843.1 CHRM2 gene_id:1129|Hs108|chr7 (466 aa) initn: 690 init1: 409 opt: 452 Z-score: 379.1 bits: 79.5 E(32554): 8.5e-15 Smith-Waterman score: 671; 29.5% identity (61.1% similar) in 475 aa overlap (18-483:10-455) 10 20 30 40 50 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASP----QLMPLVVVLSTICLVTVGLNLLVLYAVRSER :. ...:: ... .:.: ... :::. :.::. ... .: CCDS58 MNNSTNSSNNSLALTSPYKTFEVVFIVLVAGSLSLVTIIGNILVMVSIKVNR 10 20 30 40 50 60 70 80 90 100 110 pF1KE9 KLHTVGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIF .:.::.: .. ::. ::::.:. : . :: ... : :: .: .::..:::.:.::.. CCDS58 HLQTVNNYFLFSLACADLIIGVFSMNLYTLYTVIGYWPLGPVVCDLWLALDYVVSNASVM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 SVFILCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPILGWNHFMQQTSVR ...:. .::: : .:: : :: :. : .:: ::: ::. :: : .:. . . CCDS58 NLLIISFDRYFCVTKPLTYPVKRTTKMAGMMIAAAWVLSFILWAPAILFW-QFIVGVRTV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 REDKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFS .. .: .:.. . ::: ::::...: .: .: .: ... .. ... : . CCDS58 EDGECYIQFFSNAAVTFGTAIAAFYLPVIIMTVLYWHISRASKSRIKK----DKKEPVAN 180 190 200 210 220 240 250 260 270 280 290 pF1KE9 EIKLRPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDR . . : .: ::.... :.. : . .. :. : ..::. :. CCDS58 QDPVSPSLVQGRIVKPNNNN-------MPSSDDG--LEHNKIQNGKAPRDPVT---EN-- 230 240 250 260 270 300 310 320 330 340 350 pF1KE9 EVDKLYCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNT---HGASEISEDQML : . . ... ...: . :: : .. ::. ..: :. .: :.. . CCDS58 ------CVQGE--EKESSNDSTSVSAVASNMRDDEITQDENTVSTSLGHSKDENSKQTCI 280 290 300 310 320 360 370 380 390 400 410 pF1KE9 GDSQSFSRTDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRLRSHSRQYVSGLHM-NRER . . ..:: : :.:. . ::.: : . ... ... . ..: .. .::. CCDS58 RIGTKTPKSDSCTPTNTTV-EVVGSSGQN-GDEKQNIVARKIVKMTKQPAKKKPPPSREK 330 340 350 360 370 380 420 430 440 450 460 470 pF1KE9 KAAKQLGFIMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLC :... . :. :::. : :: .. .. .:: : . . . :: :::::.:: : :: CCDS58 KVTRTILAILLAFIITWAPYNVMVLINTFCAPCIPNTVWTIGYWLCYINSTINPACYALC 390 400 410 420 430 440 480 pF1KE9 NENFKKTFKRILHIRS : .::::::..: CCDS58 NATFKKTFKHLLMCHYKNIGATR 450 460 >>CCDS44581.1 CHRM4 gene_id:1132|Hs108|chr11 (479 aa) initn: 691 init1: 401 opt: 450 Z-score: 377.4 bits: 79.2 E(32554): 1.1e-14 Smith-Waterman score: 669; 29.9% identity (61.0% similar) in 461 aa overlap (26-483:31-468) 10 20 30 40 50 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSE ... ...: ... :::: :.::. ... . CCDS44 MANFTPVNGSSGNQSVRLVTSSSHNRYETVEMVFIATVTGSLSLVTVVGNILVMLSIKVN 10 20 30 40 50 60 60 70 80 90 100 110 pF1KE9 RKLHTVGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASI :.:.::.: .. ::. ::::.:: : . .:.. . : :: .: .::..:::.:.::. CCDS44 RQLQTVNNYFLFSLACADLIIGAFSMNLYTVYIIKGYWPLGAVVCDLWLALDYVVSNASV 70 80 90 100 110 120 120 130 140 150 160 170 pF1KE9 FSVFILCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPILGWNHFMQQTSV ....:. .::: : .:: : :: :. : .:: ::: ::. :: :. . . .: CCDS44 MNLLIISFDRYFCVTKPLTYPARRTTKMAGLMIAAAWVLSFVLWAPAILFWQFVVGKRTV 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE9 RREDKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHC-QHRELINRSLPS ...: .: . ::: ::::...: .: .: : :.. .:: . . CCDS44 P-DNQCFIQFLSNPAVTFGTAIAAFYLPVVIMTVLYIHISLASRSRVHKHRPEGPKEKKA 190 200 210 220 230 240 250 260 270 280 290 pF1KE9 FSEIKLRPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQED . :. : ..::: : :. ... .. :.. ..: : . : . CCDS44 KTLAFLKSPLMKQSVKKP---PPGEAAREELRN---GKLEEAP---PPALPPPPRPVADK 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE9 DREVDKLYCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNTHGASEISEDQMLG : .. . .. . :.: :. . :.. . . ..:: ::. :. :.. CCDS44 DTSNESSSGSATQNTKERPATELSTTE--ATTPAMPAPPLQPRALNP--ASRWSKIQIVT 300 310 320 330 340 360 370 380 390 400 410 pF1KE9 DSQSFSRTDSDTTTETAPGK-GKLRSGSNTGLDYIKFTWKRLRSHSRQYVSGLHMNRERK . . .. :. : .:. . .: ..:.. . ... ...:.. ::... :::: CCDS44 KQTG---NECVTAIEIVPATPAGMRPAANVARKFASIARNQVRKK-RQMAA-----RERK 350 360 370 380 390 420 430 440 450 460 470 pF1KE9 AAKQLGFIMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCN ... . :. :::: : :: .. .: .::..: . . . :: :.:::.:: : ::: CCDS44 VTRTIFAILLAFILTWTPYNVMVLVNTFCQSCIPDTVWSIGYWLCYVNSTINPACYALCN 400 410 420 430 440 450 480 pF1KE9 ENFKKTFKRILHIRS .:::::...: CCDS44 ATFKKTFRHLLLCQYRNIGTAR 460 470 >>CCDS8040.1 CHRM1 gene_id:1128|Hs108|chr11 (460 aa) initn: 672 init1: 402 opt: 443 Z-score: 372.0 bits: 78.2 E(32554): 2.1e-14 Smith-Waterman score: 652; 30.5% identity (56.8% similar) in 465 aa overlap (26-486:24-436) 10 20 30 40 50 60 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHT :. . .. . . :.:: ::::: . . . .:.: CCDS80 MNTSAPPAVSPNITVLAPGKGPWQVAFIGITTGLLSLATVTGNLLVLISFKVNTELKT 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 VGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFI :.: ...::. ::::.:. : . ::::..:.:: : .::..:::::.::...... CCDS80 VNNYFLLSLACADLIIGTFSMNLYTTYLLMGHWALGTLACDLWLALDYVASNASVMNLLL 60 70 80 90 100 110 130 140 150 160 170 pF1KE9 LCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPILGWNHFMQQTSVRREDK . .::: :: .:: : :: ::. : ::..:: ::. :: :.... . .: . CCDS80 ISFDRYFSVTRPLSYRAKRTPRRAALMIGLAWLVSFVLWAPAILFWQYLVGERTVL-AGQ 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 CETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEIKL : .: . . ::. ::::. .: .: .:: :: ::. CCDS80 CYIQFLSQPIITFGTAMAAFYLPVTVMCTLYWRIY---------RETENRA--------- 180 190 200 210 240 250 260 270 280 290 pF1KE9 RPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVV---FSQEDDRE : .. ::: . ... . .. :: :.. . ..: . .: ....: CCDS80 RELAALQGSETPGKGGGSSSSSERSQPGAEGSPETPPGRCCRCCRAPRLLQAYSWKEEEE 220 230 240 250 260 270 300 310 320 330 340 350 pF1KE9 VDKLYCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNTHGASEISEDQMLGDSQ : ::: . ... :.:. : : .. . . . . .. CCDS80 ED----------------EGSME---SLTSSEGE----EPGSEVVIKMPMVDPEAQAPTK 280 290 300 310 360 370 380 390 400 410 pF1KE9 SFSRTDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRLRSHSRQYVSGLHMNRERKAAKQ . :. : .:.. ::. :.:.. : :. .. . . . .:.:::. CCDS80 QPPRS-SPNTVKRPTKKGRDRAGKGQ-----KPRGKEQLAKRKTF----SLVKEKKAART 320 330 340 350 360 420 430 440 450 460 470 pF1KE9 LGFIMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCNENFK :. :. :::: : :: :. .: .:::.: : : . :: :.:::.::. : :::. :. CCDS80 LSAILLAFILTWTPYNIMVLVSTFCKDCVPETLWELGYWLCYVNSTINPMCYALCNKAFR 370 380 390 400 410 420 480 pF1KE9 KTFKRILHIRS ::. .: : CCDS80 DTFRLLLLCRWDKRRWRKIPKRPGSVHRTPSRQC 430 440 450 460 >>CCDS5006.1 HTR1E gene_id:3354|Hs108|chr6 (365 aa) initn: 644 init1: 319 opt: 428 Z-score: 361.2 bits: 75.9 E(32554): 8.5e-14 Smith-Waterman score: 493; 27.2% identity (50.8% similar) in 482 aa overlap (6-486:4-362) 10 20 30 40 50 60 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHT ..: : .: :: . . .::..:. :. ::: :..:. . .::: CCDS50 MNITNCTTEASMAIRPKTITEKMLICMTLVVITTL---TTLLNLAVIMAIGTTKKLHQ 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 VGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFI .: : ::.:.::.:...:::..:.:..:..:.:: :: :::.:.. : ::. . . CCDS50 PANYLICSLAVTDLLVAVLVMPLSIIYIVMDRWKLGYFLCEVWLSVDMTCCTCSILHLCV 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE9 LCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSFLWVIPILGWNHFMQQTSVRREDKC . .::: .. . ..: . :: ::. :: .: .:.. .: : : . . ..: CCDS50 IALDRYWAITNAIEYARKRTAKRAALMILTVWTISIFISMPPLFWRSHRRLSPP--PSQC 120 130 140 150 160 170 190 200 210 220 230 240 pF1KE9 ETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEIKLR . .: . . ..... ::.: :.: .: .::.:... :.: CCDS50 TIQ-HDHVIYTIYSTLGAFYIPLTLILILYYRIYHAAKSLYQKR---------------- 180 190 200 210 250 260 270 280 290 300 pF1KE9 PENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDREVDKL CCDS50 ------------------------------------------------------------ 310 320 330 340 350 360 pF1KE9 YCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTDEQGLNTHGASEISEDQMLGDSQSFSR :::: ::: :: : :. .. .... ..: :: CCDS50 ---------------GSSRHLS--NRS-----TDSQ--NSFASCKLTQTFCVSD---FST 220 230 240 370 380 390 400 410 pF1KE9 TDSDTTTETAPGKGKLRSGS-NTGLDYIKFTWKRLRSHSRQYVSGLHMNRERKAAKQLGF :: ::: ....: .. ::. :: .:. .::::::. ::. CCDS50 --SDPTTEFEKFHASIRIPPFDNDLDH---------PGERQQISS---TRERKAARILGL 250 260 270 280 290 420 430 440 450 460 470 pF1KE9 IMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTIWLGYINSTLNPLIYPLCNENFKKTF :..:::: :.:.:: ..... . .. : ::::.:: .:::.: ::.:: .: CCDS50 ILGAFILSWLPFFIKELIVGLSIYTVSSEVADFLTWLGYVNSLINPLLYTSFNEDFKLAF 300 310 320 330 340 350 480 pF1KE9 KRILHIRS :.... : CCDS50 KKLIRCREHT 360 >>CCDS4986.1 HTR1B gene_id:3351|Hs108|chr6 (390 aa) initn: 691 init1: 306 opt: 427 Z-score: 360.0 bits: 75.7 E(32554): 9.8e-14 Smith-Waterman score: 531; 27.5% identity (53.9% similar) in 488 aa overlap (2-486:27-387) 10 20 30 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLS : :...: .: . . ... : . ::..:. CCDS49 MEEPGAQCAPPPPAGSETWVPQANLSSAPSQNCSAKDYI---YQDSISLPWKVLLVMLLA 10 20 30 40 50 40 50 60 70 80 90 pF1KE9 TICLVTVGLNLLVLYAVRSERKLHTVGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSL : :.:. : .:. .: ::::: .: :.::.:.::.:. .:::.. .: . ..:.: CCDS49 LITLATTLSNAFVIATVYRTRKLHTPANYLIASLAVTDLLVSILVMPISTMYTVTGRWTL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE9 GRPLCLFWLSMDYVASTASIFSVFILCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLS :. .: :::: : . ::::. . .. .::: .. . ..: :: ::.. : .: .: CCDS49 GQVVCDFWLSSDITCCTASILHLCVIALDRYWAITDAVEYSAKRTPKRAAVMIALVWVFS 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE9 FLWVIPILGWNHFMQQTSVRRE-DKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIY . .: . : .:.....: ..: .. : . :.... ::.::::.. .:..:: CCDS49 ISISLPPFFW----RQAKAEEEVSECVVNT-DHILYTVYSTVGAFYFPTLLLIALYGRIY 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE9 KAVRQHCQHRELINRSLPSFSEIKLRPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLK .:.. .:: . CCDS49 VEARSR--------------------------------------ILK------------Q 240 280 290 300 310 320 330 pF1KE9 SPSQTPKEMKSPVVFSQEDDREVDKLYCFPLDIVHMQAAAEGSSRDYVAVNRSHGQLKTD .:..: :.. ...:: :: CCDS49 TPNRTGKRL-------------------------------------------TRAQLITD 250 340 350 360 370 380 390 pF1KE9 EQGLNTHGASEISEDQMLGDSQSFSRTDSDTTTETAPGKGKLRSGSNTGLDYIKFTWKRL : .: ... :. ::. :. .: ::: . .. .: :. CCDS49 SPG-STSSVTSIN-----------SRVP-DVPSE---------SGSPVYVNQVKV---RV 260 270 280 290 400 410 420 430 440 450 pF1KE9 RSHSRQYVSGLHMNRERKAAKQLGFIMAAFILCWIPYFIFFMVIAFCKNCCNEHLHMFTI : . . : :::::.: ::.:..:::.::.:.::. .:. .::. : :: .: . CCDS49 -SDALLEKKKLMAARERKATKTLGIILGAFIVCWLPFFIISLVMPICKDACWFHLAIFDF 300 310 320 330 340 350 460 470 480 pF1KE9 --WLGYINSTLNPLIYPLCNENFKKTFKRILHIRS ::::.:: .::.:: . ::.::..:....... CCDS49 FTWLGYLNSLINPIIYTMSNEDFKQAFHKLIRFKCTS 360 370 380 390 >>CCDS4292.1 ADRB2 gene_id:154|Hs108|chr5 (413 aa) initn: 566 init1: 296 opt: 412 Z-score: 347.8 bits: 73.5 E(32554): 4.8e-13 Smith-Waterman score: 412; 31.4% identity (67.6% similar) in 207 aa overlap (32-234:38-240) 10 20 30 40 50 60 pF1KE9 SLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHTV .:.: : :. : :.::. :. . ..:.:: CCDS42 SAFLLAPNGSHAPDHDVTQERDEVWVVGMGIVMSLIVLAIVFGNVLVITAIAKFERLQTV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE9 GNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFIL : .:.::. :::..: .:.:.. ..::. :..: : :: :.: . :::: .. .. CCDS42 TNYFITSLACADLVMGLAVVPFGAAHILMKMWTFGNFWCEFWTSIDVLCVTASIETLCVI 70 80 90 100 110 120 130 140 150 160 170 pF1KE9 CIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSFLW-VIPI-LGWNHFMQQTSVR--RE .::: .. .:..: . ::..: . :: .:..: : .:: . : . .: .. . CCDS42 AVDRYFAITSPFKYQSLLTKNKARVIILMVWIVSGLTSFLPIQMHWYRATHQEAINCYAN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE9 DKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEI . : ::. . . ..:..::.: ..:.. :..... .... :. :..: : CCDS42 ETC-CDFFTNQAYAIASSIVSFYVPLVIMVFVYSRVFQEAKRQLQK---IDKSEGRFHVQ 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE9 KLRPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDREV CCDS42 NLSQVEQDGRTGHGLRRSSKFCLKEHKALKTLGIIMGTFTLCWLPFFIVNIVHVIQDNLI 250 260 270 280 290 300 >>CCDS4395.1 HRH2 gene_id:3274|Hs108|chr5 (359 aa) initn: 529 init1: 319 opt: 405 Z-score: 342.9 bits: 72.4 E(32554): 8.9e-13 Smith-Waterman score: 405; 33.8% identity (71.7% similar) in 198 aa overlap (28-222:19-214) 10 20 30 40 50 60 pF1KE9 MSLPNSSCLLEDKMCEGNKTTMASPQLMPLVVVLSTICLVTVGLNLLVLYAVRSERKLHT . ..:::... :.::. :..: :: .:.:.. CCDS43 MAPNGTASSFCLDSTACKITITVVLAVLILITVAGNVVVCLAVGLNRRLRN 10 20 30 40 50 70 80 90 100 110 120 pF1KE9 VGNLYIVSLSVADLIVGAVVMPMNILYLLMSKWSLGRPLCLFWLSMDYVASTASIFSVFI . : .::::...::..: .:.:.. .: : :::.:. .: .. :.: . ::::...:. CCDS43 LTNCFIVSLAITDLLLGLLVLPFSAIYQLSCKWSFGKVFCNIYTSLDVMLCTASILNLFM 60 70 80 90 100 110 130 140 150 160 170 pF1KE9 LCIDRYRSVQQPLRYLKYRTKTRASATILGAWFLSF-LWVIPI-LGWNHFMQQTS-VRRE . .::: .:..:::: : .:.. ... : .:. : . : :::: . .. . CCDS43 ISLDRYCAVMDPLRYPVLVTPVRVAISLVLIWVISITLSFLSIHLGWNSRNETSKGNHTT 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE9 DKCETDFYDVTWFKVMTAIINFYLPTLLMLWFYAKIYKAVRQHCQHRELINRSLPSFSEI .::... .: . .. ....:::: :.: : .:.:..:.. . CCDS43 SKCKVQVNEV--YGLVDGLVTFYLPLLIMCITYYRIFKVARDQAKRINHISSWKAATIRE 180 190 200 210 220 240 250 260 270 280 290 pF1KE9 KLRPENPKGDAKKPGKESPWEVLKRKPKDAGGGSVLKSPSQTPKEMKSPVVFSQEDDREV CCDS43 HKATVTLAAVMGAFIICWFPYFTAFVYRGLRGDDAINEVLEAIVLWLGYANSALNPILYA 230 240 250 260 270 280 487 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 03:49:18 2016 done: Mon Nov 7 03:49:19 2016 Total Scan time: 2.650 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]