FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB3323, 502 aa 1>>>pF1KB3323 502 - 502 aa - 502 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.0156+/-0.000866; mu= 20.2911+/- 0.052 mean_var=74.8840+/-14.858, 0's: 0 Z-trim(107.4): 77 B-trim: 0 in 0/52 Lambda= 0.148211 statistics sampled from 9456 (9534) to 9456 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.665), E-opt: 0.2 (0.293), width: 16 Scan time: 2.820 The best scores are: opt bits E(32554) CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 3420 740.8 8.1e-214 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 2080 454.3 1.4e-127 CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 1491 328.3 1.2e-89 CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1358 300.0 5.1e-81 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 1323 292.4 7.4e-79 CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1314 290.5 3e-78 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1285 284.3 2.1e-76 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1285 284.3 2.2e-76 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1202 266.6 4.8e-71 CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1157 256.9 3.5e-68 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1128 250.7 2.5e-66 CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1115 247.9 1.8e-65 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1019 227.4 2.8e-59 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1000 223.4 4.9e-58 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 976 218.2 1.6e-56 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 949 212.4 8.8e-55 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 907 203.4 4.2e-52 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 854 192.1 1.2e-48 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 735 166.6 4.7e-41 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 732 166.1 8.4e-41 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 682 155.3 1.3e-37 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 682 155.4 1.4e-37 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 662 151.1 2.8e-36 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 623 142.8 8.9e-34 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 608 139.6 8.2e-33 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 570 131.4 2.1e-30 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 562 129.7 7e-30 CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 552 127.6 3.2e-29 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 537 124.3 2.7e-28 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 525 121.6 1.3e-27 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 519 120.5 4e-27 CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 488 113.8 3.9e-25 CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 480 112.1 1.3e-24 CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 432 101.6 9.7e-22 CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 386 92.1 1.5e-18 CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 321 77.8 1e-14 CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 297 73.0 7.8e-13 CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 297 73.1 8.5e-13 CCDS4375.1 GABRP gene_id:2568|Hs108|chr5 ( 440) 296 72.8 8.9e-13 CCDS4354.1 GABRB2 gene_id:2561|Hs108|chr5 ( 474) 288 71.1 3.1e-12 CCDS4355.1 GABRB2 gene_id:2561|Hs108|chr5 ( 512) 288 71.1 3.2e-12 CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 286 70.7 4.1e-12 CCDS45195.1 GABRG3 gene_id:2567|Hs108|chr15 ( 467) 286 70.7 4.1e-12 CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 286 70.7 4.1e-12 CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 285 70.5 4.7e-12 CCDS45194.1 GABRA5 gene_id:2558|Hs108|chr15 ( 462) 281 69.6 8.5e-12 CCDS5020.3 GABRR2 gene_id:2570|Hs108|chr6 ( 465) 281 69.6 8.5e-12 CCDS4357.1 GABRA1 gene_id:2554|Hs108|chr5 ( 456) 280 69.4 9.7e-12 CCDS75368.1 GABRP gene_id:2568|Hs108|chr5 ( 289) 270 67.1 3.1e-11 CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 271 67.5 3.8e-11 >>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa) initn: 3420 init1: 3420 opt: 3420 Z-score: 3952.2 bits: 740.8 E(32554): 8.1e-214 Smith-Waterman score: 3420; 100.0% identity (100.0% similar) in 502 aa overlap (1-502:1-502) 10 20 30 40 50 60 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTVQL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTVQL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB3 MVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVVLY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 MVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVVLY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB3 NNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTYDR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 NNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTYDR 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB3 TEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDSTYVDITYDFIIRRKPLFYTIN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 TEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDSTYVDITYDFIIRRKPLFYTIN 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB3 LIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSLDVPLVGKY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSLDVPLVGKY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB3 LMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQPRHHCARQR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQPRHHCARQR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB3 LRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVAGPGRSGEPC :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 LRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVAGPGRSGEPC 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB3 GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCVFGTIGMFLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS10 GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCVFGTIGMFLQ 430 440 450 460 470 480 490 500 pF1KB3 PLFQNYTTTTFLHSDHSAPSSK :::::::::::::::::::::: CCDS10 PLFQNYTTTTFLHSDHSAPSSK 490 500 >>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa) initn: 2087 init1: 1763 opt: 2080 Z-score: 2403.8 bits: 454.3 E(32554): 1.4e-127 Smith-Waterman score: 2080; 64.8% identity (83.1% similar) in 486 aa overlap (11-489:7-489) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCS--GVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTV :. : :. ::. . ...::.:.. ::. .:::.::::::..:.:... CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQLISI 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 QLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVV .:..::::::::.:::::::::::: ::: ::::::. ...... .:.:.:.:::::.: CCDS10 KLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLPDIV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 LYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTY ::::::: :::: :.: .: .::..::::::::::::::::.:::::::::.::::::: CCDS10 LYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRSWTY 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 DRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDSTYVDITYDFIIRRKPLFYT :.::::.:: . .::.::::::::::::::::::. ::.: .:::.::::::.::::::: CCDS10 DHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRRTVNPQDPSYVDVTYDFIIKRKPLFYT 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 INLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSLDVPLVG ::::::::: : ::::::::::::::::::::::::::: ::::::::::::::::::.: CCDS10 INLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSLDVPLIG 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 KYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQPRHHCAR ::::::::::::::::::::::::::::.::::::::: ::.:::..:::..: . CCDS10 KYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRPGPDSSP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 QR-LRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVAGPG--- : . . . : : . . ::: ::. :. : .::: : CCDS10 ARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASA---ASKSPAGSTPVAIPRDFW 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB3 -RSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCVFG ::. ..::..:: :::.::...:.:::: :::::::::.::::::.:.::::.: CCDS10 LRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLFLWVFMFVCVLG 420 430 440 450 460 470 480 490 500 pF1KB3 TIGMFLQPLFQNYTTTTFLHSDHSAPSSK :.:.:: ::::..... CCDS10 TVGLFLPPLFQTHAASEGPYAAQRD 480 490 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 1484 init1: 624 opt: 1491 Z-score: 1723.2 bits: 328.3 E(32554): 1.2e-89 Smith-Waterman score: 1491; 48.1% identity (75.2% similar) in 468 aa overlap (22-485:27-490) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL : : ::::: ..:. :.::..:::. : :. CCDS61 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP :::.. :...:: .: : .::: ::.:: . :.::.: : : :.:... .:.:. .:: : CCDS61 VTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS :.:::::: : ..: ..:...:.: : : ::::.::.: ... ::::.:::..:: : CCDS61 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNE---NPDDSTYVDITYDFIIRR ::::..::::.. . ....:: ..::.:. : ... : . :.::::.: ::: CCDS61 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL :.::::::::::..:. :..::::::::::::.::::::::.::::::.:.. .: ::: CCDS61 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP :::::.::.:::..::.:::..: :::.:.:.:::::: :::.:::. :: .:.:. : CCDS61 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 RHHC-ARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVA . . . : .: . : : . : :: . : . .. :. CCDS61 LDKTRGTGSDAVPRGLARRPAKGKLASHGEP-RHLKECFHCHKSNELATSKRRLSHQPLQ 360 370 380 390 400 410 420 430 440 450 460 470 pF1KB3 GPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCV ...: .......:.:::..:.:... . : .::::::::.::.:::.:..::: CCDS61 WVVENSEHSPE-VEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCV 420 430 440 450 460 470 480 490 500 pF1KB3 FGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK ::: :.:::::. : CCDS61 FGTAGLFLQPLLGNTGKS 480 490 >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 1594 init1: 660 opt: 1358 Z-score: 1568.1 bits: 300.0 E(32554): 5.1e-81 Smith-Waterman score: 1358; 51.8% identity (74.2% similar) in 419 aa overlap (7-420:14-422) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWG-TDTEERLVEHLLDPSRYNKLIRPATNG :. :::: :::: : : . .::::...:. : ::: ::..: CCDS13 MELGGPGAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLF--SGYNKWSRPVANI 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 SELVTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHI :..: :.. .:.::::.: :..:.::::::. :::.::.: : : ...:. ..:.::. : CCDS13 SDVVLVRFGLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELI 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 WLPDVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMK : ::.:::::::: . :. ..: . .:: . : :::::::.:.:.: ::::::::::: CCDS13 WRPDIVLYNNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMK 120 130 140 150 160 170 180 190 200 210 220 pF1KB3 FRSWTYDRTEIDLV-LKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDF : :::::...:::: ..:.: .:: : :::: :: : : . : :::: : CCDS13 FGSWTYDKAKIDLVNMHSRVDQLD-FWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAF 180 190 200 210 220 230 230 240 250 260 270 280 pF1KB3 IIRRKPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVP .::: ::::::::::::.::. :..:::::::.::::.::::::::.::::::::..:.: CCDS13 VIRRLPLFYTINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIP 240 250 260 270 280 290 290 300 310 320 330 340 pF1KB3 PTSLDVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLF ::: .::.:.::.:::..::.::: .: ::::::::: :::: ::. :::. .: ::. CCDS13 STSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLL 300 310 320 330 340 350 350 360 370 380 390 400 pF1KB3 MQQPRHHCARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPA :..: ... : .. .. ... :. : : : ...:.: . . CCDS13 MKRPS--VVKDNCRRLIESMHKMASAPRFWPEPEGEPPAT-----SGTQSLHPPSPSFCV 360 370 380 390 400 410 410 420 430 440 450 460 pF1KB3 PVAGPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVF :. :.. : : CCDS13 PLDVPAEPGPSCKSPSDQLPPQQPLEAEKASPHPSPGPCRPPHGTQAPGLAKARSLSVQH 420 430 440 450 460 470 >-- initn: 353 init1: 291 opt: 307 Z-score: 353.6 bits: 75.3 E(32554): 2.3e-13 Smith-Waterman score: 307; 47.1% identity (73.5% similar) in 102 aa overlap (380-481:524-621) 350 360 370 380 390 400 pF1KB3 QQPRHHCARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAP . :. .::: . .::. .: . CCDS13 PRDDAAPEADGQAAGALASRNTHSAELPPPDQPSPCKCTCKKEPSSVS--PSATVKTRST 500 510 520 530 540 550 410 420 430 440 450 460 pF1KB3 VAGPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFV : : . : . .: .::.::..::::...:: : ::.::::::::::::.:::.:..: CCDS13 KAPPPH--LPLSPALTRAVEGVQYIADHLKAEDTDFSVKEDWKYVAMVIDRIFLWMFIIV 560 570 580 590 600 470 480 490 500 pF1KB3 CVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK :..::.:.:: : CCDS13 CLLGTVGLFLPPWLAGMI 610 620 >>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa) initn: 1416 init1: 624 opt: 1323 Z-score: 1529.2 bits: 292.4 E(32554): 7.4e-79 Smith-Waterman score: 1398; 46.4% identity (72.9% similar) in 468 aa overlap (22-485:27-475) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL : : ::::: ..:. :.::..:::. : :. CCDS56 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP :::.. :...:: .: :.::.: : : :.:... .:.:. .:: : CCDS56 VTVHFEVAITQLANVI---------------WNDYKLRWDPMEYDGIETLRVPADKIWKP 60 70 80 90 100 120 130 140 150 160 170 pF1KB3 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS :.:::::: : ..: ..:...:.: : : ::::.::.: ... ::::.:::..:: : CCDS56 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS 110 120 130 140 150 160 180 190 200 210 220 230 pF1KB3 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNE---NPDDSTYVDITYDFIIRR ::::..::::.. . ....:: ..::.:. : ... : . :.::::.: ::: CCDS56 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR 170 180 190 200 210 220 240 250 260 270 280 290 pF1KB3 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL :.::::::::::..:. :..::::::::::::.::::::::.::::::.:.. .: ::: CCDS56 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL 230 240 250 260 270 280 300 310 320 330 340 350 pF1KB3 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP :::::.::.:::..::.:::..: :::.:.:.:::::: :::.:::. :: .:.:. : CCDS56 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP 290 300 310 320 330 340 360 370 380 390 400 410 pF1KB3 RHHC-ARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVA . . . : .: . : : . : :: . : . .. :. CCDS56 LDKTRGTGSDAVPRGLARRPAKGKLASHGEP-RHLKECFHCHKSNELATSKRRLSHQPLQ 350 360 370 380 390 400 420 430 440 450 460 470 pF1KB3 GPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCV ...: .......:.:::..:.:... . : .::::::::.::.:::.:..::: CCDS56 WVVENSEHSPE-VEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCV 410 420 430 440 450 460 480 490 500 pF1KB3 FGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK ::: :.:::::. : CCDS56 FGTAGLFLQPLLGNTGKS 470 >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 1587 init1: 679 opt: 1314 Z-score: 1518.2 bits: 290.5 E(32554): 3e-78 Smith-Waterman score: 1584; 51.7% identity (73.9% similar) in 472 aa overlap (26-483:56-525) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL :.::.:: .::. ::. ::. : :.. CCDS60 GEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRG--YNRWARPVPNTSDV 30 40 50 60 70 80 60 70 80 90 100 110 pF1KB3 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP : :.. .:.::::.: :..:.::::::: ::: ::.: :.: .: :. ..:.::. ::.: CCDS60 VIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIWIP 90 100 110 120 130 140 120 130 140 150 160 170 pF1KB3 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS :.:::::::: . :. ...: . :.. :.:::::::.:.:.: :::::::: ::: : CCDS60 DIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKFGS 150 160 170 180 190 200 180 190 200 210 220 230 pF1KB3 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDFIIRR ::::...::: ....: :. :::: :: : : . : : :.:: :.::: CCDS60 WTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYAFVIRR 210 220 230 240 250 260 240 250 260 270 280 290 pF1KB3 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL ::::::::::::.::. :..::::::::::::.::::::::.::::::::..:.: ::: CCDS60 LPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEIIPSTSL 270 280 290 300 310 320 300 310 320 330 340 350 pF1KB3 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP .::.:.::.:::..::.::: .: :::::::::.:::: ::. ..: .: :.:..: CCDS60 VIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPRWLLMNRP 330 340 350 360 370 380 360 370 380 390 400 pF1KB3 R---HHCARQRLRLRRRQREREGAGALFFREA--PGADSCTCFVNRASVQGLAGAFGAEP . : ::.: . :. ::. : .: . : : . : CCDS60 PPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLCSHGHLH 390 400 410 420 430 440 410 420 430 440 450 460 pF1KB3 APVAGPG-----RSGEPC-GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRL . ..:: . :: . ...:..::..::::.:::: :.::.::::::::::::. CCDS60 SGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVAMVIDRI 450 460 470 480 490 500 470 480 490 500 pF1KB3 FLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK :::.:..:: .::::.:: :.. CCDS60 FLWLFIIVCFLGTIGLFLPPFLAGMI 510 520 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1253 init1: 649 opt: 1285 Z-score: 1485.2 bits: 284.3 E(32554): 2.1e-76 Smith-Waterman score: 1286; 45.1% identity (71.0% similar) in 459 aa overlap (7-443:9-460) 10 20 30 40 50 pF1KB3 MARRCGPVAL----LLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSE :.:: :: . :: : . ....:.:: :.:.. ::..:::..: :. CCDS53 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFED--YNEIIRPVANVSD 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 LVTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWL : ... ::..::..: : .::: ::.:: : :.::.: :.: .. . . .:.:...:: CCDS53 PVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 PDVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFR ::.:::::: : ..:. ..:...: : . :.::::.::.:::.: .:::: ::::::: CCDS53 PDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 SWTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNE---NPDDSTYVDITYDFIIR ::.::...::::: . .: :. :::: :. :: ... : . : ::::.. :: CCDS53 SWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 RKPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTS : ::::::::::::.::. :..::::::::::::.::::::::.::::::.:.. .: :: CCDS53 RLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTS 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 LDVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQ : .::.:.::.:::..::.::: .: :::::.:.:::::: :::.:::. :: ..:: . CCDS53 LVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 PRHHCARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPV- : . . . . : :: . :.: : . .:. : . . CCDS53 PTSNEGNAQ-----KPRPLYGAELSNLNCFSRAESKGCKEGYPCQDGMCGYCHHRRIKIS 360 370 380 390 400 410 420 430 440 450 pF1KB3 ---AGPGRSGEPCGCG-----------LREAVDGVRFIADHMRSEDDDQSVSEDWKYVAM :. ::. . ..::...:..::..:..... CCDS53 NFSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEEQKAQEIQQL 420 430 440 450 460 470 460 470 480 490 500 pF1KB3 VIDRLFLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK CCDS53 KRKEKSTETSDQEPGL 480 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 1509 init1: 649 opt: 1285 Z-score: 1485.0 bits: 284.3 E(32554): 2.2e-76 Smith-Waterman score: 1494; 46.9% identity (73.8% similar) in 497 aa overlap (7-482:9-499) 10 20 30 40 50 pF1KB3 MARRCGPVAL----LLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSE :.:: :: . :: : . ....:.:: :.:.. ::..:::..: :. CCDS10 MGSGPLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFED--YNEIIRPVANVSD 10 20 30 40 50 60 70 80 90 100 110 pF1KB3 LVTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWL : ... ::..::..: : .::: ::.:: : :.::.: :.: .. . . .:.:...:: CCDS10 PVIIHFEVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWK 60 70 80 90 100 110 120 130 140 150 160 170 pF1KB3 PDVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFR ::.:::::: : ..:. ..:...: : . :.::::.::.:::.: .:::: ::::::: CCDS10 PDIVLYNNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFG 120 130 140 150 160 170 180 190 200 210 220 230 pF1KB3 SWTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNE---NPDDSTYVDITYDFIIR ::.::...::::: . .: :. :::: :. :: ... : . : ::::.. :: CCDS10 SWSYDKAKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 RKPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTS : ::::::::::::.::. :..::::::::::::.::::::::.::::::.:.. .: :: CCDS10 RLPLFYTINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTS 240 250 260 270 280 290 300 310 320 330 340 pF1KB3 LDVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFM-- : .::.:.::.:::..::.::: .: :::::.:.:::::: :::.:::. :: ..:: CCDS10 LVIPLIGEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTR 300 310 320 330 340 350 350 360 370 380 390 pF1KB3 --------QQPRHHCARQRLRLRRRQR-EREGAGALFFREAPGADS-CT-CFVNRASVQG :.:: . . : .: : .: . : :. : : : .... CCDS10 PTSNEGNAQKPRPLYGAELSNLNCFSRAESKGCKEGY----PCQDGMCGYCHHRRIKISN 360 370 380 390 400 410 400 410 420 430 440 450 pF1KB3 LAGAFG-AEPAPVAGPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMV ... . . . . : . ..::...:..::..:..... . ...:::::::: CCDS10 FSANLTRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMV 420 430 440 450 460 470 460 470 480 490 500 pF1KB3 IDRLFLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK :::.:::.:..::..:: :.::::: CCDS10 IDRIFLWVFTLVCILGTAGLFLQPLMAREDA 480 490 500 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 1505 init1: 619 opt: 1202 Z-score: 1389.0 bits: 266.6 E(32554): 4.8e-71 Smith-Waterman score: 1505; 50.2% identity (71.2% similar) in 472 aa overlap (26-483:56-510) 10 20 30 40 50 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL :.::.:: .::. ::. ::. : :. CCDS64 GEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRG--YNRWARPVPNTSD- 30 40 50 60 70 80 60 70 80 90 100 110 pF1KB3 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP : :..:.::::::: ::: ::.: :.: .: :. ..:.::. ::.: CCDS64 --------------VDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVPSEMIWIP 90 100 110 120 120 130 140 150 160 170 pF1KB3 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS :.:::::::: . :. ...: . :.. :.:::::::.:.:.: :::::::: ::: : CCDS64 DIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQNCKMKFGS 130 140 150 160 170 180 180 190 200 210 220 230 pF1KB3 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDST---YVDITYDFIIRR ::::...::: ....: :. :::: :: : : . : : :.:: :.::: CCDS64 WTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVTYAFVIRR 190 200 210 220 230 240 240 250 260 270 280 290 pF1KB3 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL ::::::::::::.::. :..::::::::::::.::::::::.::::::::..:.: ::: CCDS64 LPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITEIIPSTSL 250 260 270 280 290 300 300 310 320 330 340 350 pF1KB3 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP .::.:.::.:::..::.::: .: :::::::::.:::: ::. ..: .: :.:..: CCDS64 VIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPRWLLMNRP 310 320 330 340 350 360 360 370 380 390 400 pF1KB3 R---HHCARQRLRLRRRQREREGAGALFFREA--PGADSCTCFVNRASVQGLAGAFGAEP . : ::.: . :. ::. : .: . : : . : CCDS64 PPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTLCSHGHLH 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB3 APVAGPG-----RSGEPC-GCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRL . ..:: . :: . ...:..::..::::.:::: :.::.::::::::::::. CCDS64 SGASGPKAEALLQEGELLLSPHMQKALEGVHYIADHLRSEDADSSVKEDWKYVAMVIDRI 430 440 450 460 470 480 470 480 490 500 pF1KB3 FLWIFVFVCVFGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK :::.:..:: .::::.:: :.. CCDS64 FLWLFIIVCFLGTIGLFLPPFLAGMI 490 500 510 >>CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 (458 aa) initn: 1283 init1: 632 opt: 1157 Z-score: 1337.6 bits: 256.9 E(32554): 3.5e-68 Smith-Waterman score: 1264; 41.9% identity (71.2% similar) in 472 aa overlap (27-496:27-458) 10 20 30 40 50 60 pF1KB3 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSELVTVQL ..:. :..::.. :.: .::. .... . : . CCDS61 MLPDFMLVLIVLGIPSSATTGFNSIAENEDALLRHLFQG--YQKWVRPVLHSNDTIKVYF 10 20 30 40 50 70 80 90 100 110 120 pF1KB3 MVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLPDVVLY ....::..: :..:.::::::: ::: :..: :.:... .......::. .::::.::. CCDS61 GLKISQLVDVDEKNQLMTTNVWLKQEWTDHKLRWNPDDYGGIHSIKVPSESLWLPDIVLF 60 70 80 90 100 110 130 140 150 160 170 180 pF1KB3 NNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRSWTYDR .:::: .: :......:. .:.. : ::: :::.: ..: ::::.:::.::: ::::: CCDS61 ENADGRFEGSLMTKVIVKSNGTVVWTPPASYKSSCTMDVTFFPFDRQNCSMKFGSWTYDG 120 130 140 150 160 170 190 200 210 220 230 pF1KB3 TEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNENPDDS-TYVDITYDFIIRRKPLFYTI : .::.: .: .. :: .:::.:. : ... : .: :::.:..:: :::::. CCDS61 TMVDLILINENVDRKDFFDNGEWEILNAKGMKGNRRDGVYSYPFITYSFVLRRLPLFYTL 180 190 200 210 220 230 240 250 260 270 280 290 pF1KB3 NLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSLDVPLVGK :::::. .. :..:::::::: :::..: :::..::::::.: .:.: .: .::.:. CCDS61 FLIIPCLGLSFLTVLVFYLPSDEGEKLSLSTSVLVSLTVFLLVIEEIIPSSSKVIPLIGE 240 250 260 270 280 290 300 310 320 330 340 350 pF1KB3 YLMFTMVLVTFSIVTSVCVLNVHHRSPTT-HTMAPWVKVVFLEKLPALLFMQQPRHHCAR ::.: :..::.::...: :.:::::: .: : :::::: .::.::: :: :.. : : CCDS61 YLLFIMIFVTLSIIVTVFVINVHHRSSSTYHPMAPWVKRLFLQKLPKLLCMKD---HVDR 300 310 320 330 340 350 360 370 380 390 400 410 pF1KB3 QRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVAGPGRSGE . :.: :. . . . .. . : : : . :: CCDS61 YS------SPEKE--------ESQPVVKGKVLEKKKQKQLSDG----EKVLVA------- 360 370 380 390 420 430 440 450 460 470 pF1KB3 PCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCVFGTIGMF :..:.:..:.:. :...: ..: .:::.::.:.::.:::.:..: : :.. .: CCDS61 ----FLEKAADSIRYISRHVKKEHFISQVVQDWKFVAQVLDRIFLWLFLIVSVTGSVLIF 400 410 420 430 440 480 490 500 pF1KB3 LQPLFQNYTTTTFLHSDHSAPSSK : .::: : CCDS61 TPAL------KMWLHSYH 450 502 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sat Nov 5 12:27:02 2016 done: Sat Nov 5 12:27:02 2016 Total Scan time: 2.820 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]