FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4475, 494 aa 1>>>pF1KE4475 494 - 494 aa - 494 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.2539+/-0.00103; mu= 18.6567+/- 0.062 mean_var=73.4332+/-14.845, 0's: 0 Z-trim(104.2): 78 B-trim: 0 in 0/49 Lambda= 0.149668 statistics sampled from 7680 (7758) to 7680 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.603), E-opt: 0.2 (0.238), width: 16 Scan time: 2.930 The best scores are: opt bits E(32554) CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 494) 3393 742.4 2.7e-214 CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 ( 479) 2775 608.9 3.8e-174 CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 489) 1864 412.2 6.4e-115 CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 ( 505) 1864 412.2 6.6e-115 CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 ( 627) 1578 350.5 3e-96 CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 529) 1522 338.4 1.2e-92 CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 ( 502) 1491 331.7 1.1e-90 CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 498) 1460 325.0 1.2e-88 CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 ( 514) 1394 310.7 2.4e-84 CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 468) 1324 295.6 7.8e-80 CCDS6134.1 CHRNB3 gene_id:1142|Hs108|chr8 ( 458) 1303 291.1 1.8e-78 CCDS2261.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 457) 1272 284.4 1.8e-76 CCDS3459.1 CHRNA9 gene_id:55584|Hs108|chr4 ( 479) 1137 255.2 1.1e-67 CCDS33331.1 CHRNA1 gene_id:1134|Hs108|chr2 ( 482) 1117 250.9 2.3e-66 CCDS10027.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 502) 1049 236.2 6.2e-62 CCDS53924.1 CHRNA7 gene_id:1139|Hs108|chr15 ( 531) 1040 234.3 2.5e-61 CCDS7745.1 CHRNA10 gene_id:57053|Hs108|chr11 ( 450) 997 225.0 1.4e-58 CCDS53710.1 HTR3A gene_id:3359|Hs108|chr11 ( 463) 724 166.0 7.7e-41 CCDS8365.2 HTR3A gene_id:3359|Hs108|chr11 ( 484) 724 166.1 8e-41 CCDS32184.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 412) 716 164.3 2.3e-40 CCDS58754.1 CHRND gene_id:1144|Hs108|chr2 ( 502) 703 161.5 1.9e-39 CCDS2494.1 CHRND gene_id:1144|Hs108|chr2 ( 517) 670 154.4 2.7e-37 CCDS8366.2 HTR3A gene_id:3359|Hs108|chr11 ( 516) 639 147.7 2.8e-35 CCDS58868.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 581 135.2 1.5e-31 CCDS3251.1 HTR3E gene_id:285242|Hs108|chr3 ( 471) 581 135.2 1.5e-31 CCDS8364.1 HTR3B gene_id:9177|Hs108|chr11 ( 441) 564 131.5 1.9e-30 CCDS33400.1 CHRNG gene_id:1146|Hs108|chr2 ( 517) 563 131.3 2.5e-30 CCDS3250.1 HTR3C gene_id:170572|Hs108|chr3 ( 447) 553 129.1 9.8e-30 CCDS11058.1 CHRNE gene_id:1145|Hs108|chr17 ( 493) 545 127.4 3.5e-29 CCDS11106.1 CHRNB1 gene_id:1140|Hs108|chr17 ( 501) 526 123.3 6.1e-28 CCDS42008.1 CHRFAM7A gene_id:89832|Hs108|chr15 ( 321) 522 122.3 7.8e-28 CCDS58869.1 HTR3E gene_id:285242|Hs108|chr3 ( 441) 496 116.8 4.9e-26 CCDS58870.1 HTR3E gene_id:285242|Hs108|chr3 ( 456) 496 116.8 5e-26 CCDS58871.1 HTR3E gene_id:285242|Hs108|chr3 ( 482) 404 97.0 5e-20 CCDS76786.1 CHRNA5 gene_id:1138|Hs108|chr15 ( 160) 386 92.7 3.1e-19 CCDS3796.1 GLRB gene_id:2743|Hs108|chr4 ( 497) 333 81.6 2.1e-15 CCDS3473.1 GABRA4 gene_id:2557|Hs108|chr4 ( 554) 327 80.4 5.7e-15 CCDS58392.1 CHRNB4 gene_id:1143|Hs108|chr15 ( 231) 316 77.7 1.5e-14 CCDS3474.1 GABRB1 gene_id:2560|Hs108|chr4 ( 474) 319 78.6 1.7e-14 CCDS10019.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 318 78.4 1.9e-14 CCDS10018.1 GABRB3 gene_id:2562|Hs108|chr15 ( 473) 318 78.4 1.9e-14 CCDS14706.1 GABRA3 gene_id:2556|Hs108|chrX ( 492) 317 78.2 2.3e-14 CCDS3471.1 GABRA2 gene_id:2555|Hs108|chr4 ( 451) 315 77.7 2.9e-14 CCDS82921.1 GABRA2 gene_id:2555|Hs108|chr4 ( 511) 315 77.8 3.2e-14 CCDS14160.1 GLRA2 gene_id:2742|Hs108|chrX ( 452) 313 77.3 3.9e-14 CCDS4356.1 GABRA6 gene_id:2559|Hs108|chr5 ( 453) 313 77.3 3.9e-14 CCDS4358.1 GABRG2 gene_id:2566|Hs108|chr5 ( 467) 313 77.3 4e-14 CCDS4359.1 GABRG2 gene_id:2566|Hs108|chr5 ( 475) 313 77.3 4.1e-14 CCDS48085.1 GLRA2 gene_id:2742|Hs108|chrX ( 452) 311 76.9 5.3e-14 CCDS54617.1 GABRR3 gene_id:200959|Hs108|chr3 ( 467) 310 76.7 6.3e-14 >>CCDS6135.1 CHRNA6 gene_id:8973|Hs108|chr8 (494 aa) initn: 3393 init1: 3393 opt: 3393 Z-score: 3960.9 bits: 742.4 E(32554): 2.7e-214 Smith-Waterman score: 3393; 100.0% identity (100.0% similar) in 494 aa overlap (1-494:1-494) 10 20 30 40 50 60 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 VLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 VLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWT 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 YDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 YDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 MFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 MFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 PLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 PLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 KTRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 KTRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE4 ENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS61 ENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTA 430 440 450 460 470 480 490 pF1KE4 GLFLQPLLGNTGKS :::::::::::::: CCDS61 GLFLQPLLGNTGKS 490 >>CCDS56536.1 CHRNA6 gene_id:8973|Hs108|chr8 (479 aa) initn: 3274 init1: 2773 opt: 2775 Z-score: 3239.9 bits: 608.9 E(32554): 3.8e-174 Smith-Waterman score: 3248; 97.0% identity (97.0% similar) in 494 aa overlap (1-494:1-479) 10 20 30 40 50 60 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVT 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 VHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDI ::::::::::::: :::::::::::::::::::::::::::::::: CCDS56 VHFEVAITQLANV---------------IWNDYKLRWDPMEYDGIETLRVPADKIWKPDI 70 80 90 100 130 140 150 160 170 180 pF1KE4 VLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWT :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 VLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWT 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 YDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 YDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLP 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE4 MFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVV 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE4 PLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 PLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLD 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE4 KTRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 KTRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVV 350 360 370 380 390 400 430 440 450 460 470 480 pF1KE4 ENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 ENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTA 410 420 430 440 450 460 490 pF1KE4 GLFLQPLLGNTGKS :::::::::::::: CCDS56 GLFLQPLLGNTGKS 470 >>CCDS53964.1 CHRNA3 gene_id:1136|Hs108|chr15 (489 aa) initn: 1964 init1: 1826 opt: 1864 Z-score: 2176.6 bits: 412.2 E(32554): 6.4e-115 Smith-Waterman score: 1961; 67.3% identity (84.3% similar) in 434 aa overlap (34-451:35-463) 10 20 30 40 50 60 pF1KE4 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF :.:::..:: ::..:::: :::::: .:: CCDS53 PLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPVIIHF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY ::...::..::::::::::::::..:::::::.:.: .: : : .::::.:::::::::: CCDS53 EVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPDIVLY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK :::::::::. ::::::::.: .:: ::::::::: .:.:.::::.:::..:::::.::: CCDS53 NNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSWSYDK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY :.:::..:::.....:.::..:: :: : ::::::::::::::: :::::.::::::.:: CCDS53 AKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRLPLFY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV :::::::::.::::::::::::::::::::::::::::::::::::::::::::::.::. CCDS53 TINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVIPLI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLDKTR ::::::::::::::::.::::::.::::::::::: :::::::.:::.:..: : : CCDS53 GEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRP---TS 310 320 330 340 350 360 370 380 390 400 pF1KE4 GTGSDAVPRGL-----------ARRPAKGKLASHGEPRHLKECFHCHK-----SNELATS . :. :: : .: .:: ..: : . : .::. :: :. CCDS53 NEGNAQKPRPLYGAELSNLNCFSRAESKG--CKEGYPCQDGMCGYCHHRRIKISNFSANL 370 380 390 400 410 410 420 430 440 450 460 pF1KE4 KRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF : : . .. :. : :::....:.::..::::::..::.:: CCDS53 TRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEEQKAQEIQQLKRKEKS 420 430 440 450 460 470 470 480 490 pF1KE4 LWVFIIVCVFGTAGLFLQPLLGNTGKS CCDS53 TETSDQEPGL 480 >>CCDS10305.1 CHRNA3 gene_id:1136|Hs108|chr15 (505 aa) initn: 2175 init1: 1832 opt: 1864 Z-score: 2176.4 bits: 412.2 E(32554): 6.6e-115 Smith-Waterman score: 2191; 67.9% identity (85.4% similar) in 471 aa overlap (34-488:35-500) 10 20 30 40 50 60 pF1KE4 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF :.:::..:: ::..:::: :::::: .:: CCDS10 PLSLPLALSPPRLLLLLLLSLLPVARASEAEHRLFERLFEDYNEIIRPVANVSDPVIIHF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY ::...::..::::::::::::::..:::::::.:.: .: : : .::::.:::::::::: CCDS10 EVSMSQLVKVDEVNQIMETNLWLKQIWNDYKLKWNPSDYGGAEFMRVPAQKIWKPDIVLY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK :::::::::. ::::::::.: .:: ::::::::: .:.:.::::.:::..:::::.::: CCDS10 NNAVGDFQVDDKTKALLKYTGEVTWIPPAIFKSSCKIDVTYFPFDYQNCTMKFGSWSYDK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY :.:::..:::.....:.::..:: :: : ::::::::::::::: :::::.::::::.:: CCDS10 AKIDLVLIGSSMNLKDYWESGEWAIIKAPGYKHDIKYNCCEEIYPDITYSLYIRRLPLFY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV :::::::::.::::::::::::::::::::::::::::::::::::::::::::::.::. CCDS10 TINLIIPCLLISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVIPLI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLDKTR ::::::::::::::::.::::::.::::::::::: :::::::.:::.:..: : : CCDS10 GEYLLFTMIFVTLSIVITVFVLNVHYRTPTTHTMPSWVKTVFLNLLPRVMFMTRP---TS 310 320 330 340 350 360 370 380 390 400 pF1KE4 GTGSDAVPRGL-----------ARRPAKGKLASHGEPRHLKECFHCHK-----SNELATS . :. :: : .: .:: ..: : . : .::. :: :. CCDS10 NEGNAQKPRPLYGAELSNLNCFSRAESKG--CKEGYPCQDGMCGYCHHRRIKISNFSANL 370 380 390 400 410 410 420 430 440 450 460 pF1KE4 KRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF : : . .. :. : :::....:.::..::::::..::.::..:::::::::.::.: CCDS10 TRSSSSESVDAVLSLSALSPEIKEAIQSVKYIAENMKAQNEAKEIQDDWKYVAMVIDRIF 420 430 440 450 460 470 470 480 490 pF1KE4 LWVFIIVCVFGTAGLFLQPLLGNTGKS :::: .::..::::::::::. CCDS10 LWVFTLVCILGTAGLFLQPLMAREDA 480 490 500 >>CCDS13517.1 CHRNA4 gene_id:1137|Hs108|chr20 (627 aa) initn: 1822 init1: 1578 opt: 1578 Z-score: 1841.4 bits: 350.5 E(32554): 3e-96 Smith-Waterman score: 1578; 67.7% identity (87.1% similar) in 325 aa overlap (34-358:37-361) 10 20 30 40 50 60 pF1KE4 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF ::::..:::: ::.. ::: :.:: : :.: CCDS13 GAPRLLPPLLLLLGTGLLRASSHVETRAHAEERLLKKLFSGYNKWSRPVANISDVVLVRF 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY ..:.:: .::: ::.: ::.:... :.:::::::: .:... ..:.:.. ::.:::::: CCDS13 GLSIAQLIDVDEKNQMMTTNVWVKQEWHDYKLRWDPADYENVTSIRIPSELIWRPDIVLY 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 NNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYDK ::: ::: : ::: : ..: . ::::::.:::: .:.::::::.:::..::::::::: CCDS13 NNADGDFAVTHLTKAHLFHDGRVQWTPPAIYKSSCSIDVTFFPFDQQNCTMKFGSWTYDK 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 AEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMFY :.:::. . :.::. ::::..:: :.:: : . ::.:: ::: ::::.: :::::.:: CCDS13 AKIDLVNMHSRVDQLDFWESGEWVIVDAVGTYNTRKYECCAEIYPDITYAFVIRRLPLFY 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 TINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPLV :::::::::.:: ::::::::::.::::.:::::::::::::::.::: :::::::.::. CCDS13 TINLIIPCLLISCLTVLVFYLPSECGEKITLCISVLLSLTVFLLLITEIIPSTSLVIPLI 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 GEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWPLDKTR ::::::::::::::::.::::::.:.:.: ::::: ::. ::: ..:..:::. : CCDS13 GEYLLFTMIFVTLSIVITVFVLNVHHRSPRTHTMPTWVRRVFLDIVPRLLLMKRPSVVKD 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 GTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVVENS CCDS13 NCRRLIESMHKMASAPRFWPEPEGEPPATSGTQSLHPPSPSFCVPLDVPAEPGPSCKSPS 370 380 390 400 410 420 >>CCDS6059.1 CHRNA2 gene_id:1135|Hs108|chr8 (529 aa) initn: 1766 init1: 1520 opt: 1522 Z-score: 1777.1 bits: 338.4 E(32554): 1.2e-92 Smith-Waterman score: 1733; 53.9% identity (76.0% similar) in 484 aa overlap (22-488:47-525) 10 20 30 40 50 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP : . .: ::.:::..:: ::.. :: CCDS60 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE4 VENVSDPVTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVP : :.:: : :.: ..:.:: .::: ::.: ::.::.. :.::::::.: .. .: .:::: CCDS60 VPNTSDVVIVRFGLSIAQLIDVDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP 80 90 100 110 120 130 120 130 140 150 160 170 pF1KE4 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN .. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.:: CCDS60 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN 140 150 160 170 180 190 180 190 200 210 220 230 pF1KE4 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT :..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.: CCDS60 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT 200 210 220 230 240 250 240 250 260 270 280 290 pF1KE4 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE :.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.::: CCDS60 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE 260 270 280 290 300 310 300 310 320 330 340 350 pF1KE4 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ :::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:. CCDS60 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR 320 330 340 350 360 370 360 370 380 390 pF1KE4 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE ::: : :. . .. :: : .. .. . :.: : CCDS60 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL 380 390 400 410 420 430 400 410 420 430 440 450 pF1KE4 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED : : : . . : . : . .. ::... ....:..::....:.. . :.. CCDS60 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE 440 450 460 470 480 490 460 470 480 490 pF1KE4 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS ::::::::.::.:::.::::: .:: :::: :.: CCDS60 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 500 510 520 >>CCDS1070.1 CHRNB2 gene_id:1141|Hs108|chr1 (502 aa) initn: 1484 init1: 624 opt: 1491 Z-score: 1741.2 bits: 331.7 E(32554): 1.1e-90 Smith-Waterman score: 1491; 48.1% identity (75.4% similar) in 468 aa overlap (27-490:22-485) 10 20 30 40 50 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP : : ::::: ..:. :.::..:::. : :. CCDS10 MARRCGPVALLLGFGLLRLCSGVWGTDTEERLVEHLLDPSRYNKLIRPATNGSEL 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 VTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKP :::.. :...:: .: : .::: ::.:: . :.::.: : : :.:... .:.:. .:: : CCDS10 VTVQLMVSLAQLISVHEREQIMTTNVWLTQEWEDYRLTWKPEEFDNMKKVRLPSKHIWLP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS :.:::::: : ..: ..:...:.: : : ::::.::.: ... ::::.:::..:: : CCDS10 DVVLYNNADGMYEVSFYSNAVVSYDGSIFWLPPAIYKSACKIEVKHFPFDQQNCTMKFRS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR ::::..::::.. . ....:: ..::.:. : ... : . :.::::.: ::: CCDS10 WTYDRTEIDLVLKSEVASLDDFTPSGEWDIVALPGRRNE---NPDDSTYVDITYDFIIRR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL :.::::::::::..:. :..::::::::::::.::::::::.::::::.:.. .: ::: CCDS10 KPLFYTINLIIPCVLITSLAILVFYLPSDCGEKMTLCISVLLALTVFLLLISKIVPPTSL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP :::::.::.:::..::.:::..: :::.:.:.:::::: :::.:::. :: .:.:. : CCDS10 DVPLVGKYLMFTMVLVTFSIVTSVCVLNVHHRSPTTHTMAPWVKVVFLEKLPALLFMQQP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 LDKTRGTGSDAVPRGLARRPAKGKLASHGEPRHLK-ECFHCHKSNELATSKRRLSHQPLQ . . . : .: . : : . : . :: . : . .. :. CCDS10 RHHC-ARQRLRLRRRQREREGAGALFFREAPGADSCTCFVNRASVQGLAGAFGAEPAPVA 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 WVVENSEHSPE-VEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCV ...: .......:.:::..:.:... . : .::::::::.::.:::.:..::: CCDS10 GPGRSGEPCGCGLREAVDGVRFIADHMRSEDDDQSVSEDWKYVAMVIDRLFLWIFVFVCV 420 430 440 450 460 470 480 490 pF1KE4 FGTAGLFLQPLLGNTGKS ::: :.:::::. : CCDS10 FGTIGMFLQPLFQNYTTTTFLHSDHSAPSSK 480 490 500 >>CCDS10306.1 CHRNB4 gene_id:1143|Hs108|chr15 (498 aa) initn: 1301 init1: 718 opt: 1460 Z-score: 1705.1 bits: 325.0 E(32554): 1.2e-88 Smith-Waterman score: 1460; 45.6% identity (73.8% similar) in 474 aa overlap (28-488:21-483) 10 20 30 40 50 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLF--SHYNQFIRPVENVSDP : .::.:. :. ..::..:::. . :. CCDS10 MRRAPSLVLFFLVALCGRGNCRVANAEEKLMDDLLNKTRYNNLIRPATSSSQL 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 VTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKP ..........:: .:.: .::: ::.::.. :.::.: :. .:.:.. ::.:: .:: : CCDS10 ISIKLQLSLAQLISVNEREQIMTTNVWLKQEWTDYRLTWNSSRYEGVNILRIPAKRIWLP 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 DIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGS :::::::: : ..: :. ... :: . : ::::.::.: ... .::::.:::.::: : CCDS10 DIVLYNNADGTYEVSVYTNLIVRSNGSVLWLPPAIYKSACKIEVKYFPFDQQNCTLKFRS 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 WTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRR ::::..:::.... ..:.:: ..::.:. : . : . :.:.::.: :.: CCDS10 WTYDHTEIDMVLMTPTASMDDFTPSGEWDIVALPGRR---TVNPQDPSYVDVTYDFIIKR 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 LPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSL :.::::::::::.. ..:..::::::::::::.::::::::.:: :::.:.. .: ::: CCDS10 KPLFYTINLIIPCVLTTLLAILVFYLPSDCGEKMTLCISVLLALTFFLLLISKIVPPTSL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 VVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQVLLMRWP :::.:.::.:::..::.:::..: :::.:.:.:.:::: ::: ::. :: :.:. : CCDS10 DVPLIGKYLMFTMVLVTFSIVTSVCVLNVHHRSPSTHTMAPWVKRCFLHKLPTFLFMKRP 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 LDKTRGTGSDAVPRGLARRPAKGKL------ASHGEPRHLKECFHCHKSNELATSKRRLS : :. : . : :.:. . :. : .. . :.:: . CCDS10 -------GPDSSP-ARAFPPSKSCVTKPEATATSTSPSNFYGNSMYFVNPASAASKSPAG 360 370 380 390 400 420 430 440 450 460 pF1KE4 HQPLQ-----WVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVF :. :. ... .:......:.:::..::. .: . : .:::::::::::.: CCDS10 STPVAIPRDFWLRSSGRFRQDVQEALEGVSFIAQHMKNDDEDQSVVEDWKYVAMVVDRLF 410 420 430 440 450 460 470 480 490 pF1KE4 LWVFIIVCVFGTAGLFLQPLLGNTGKS ::::..:::.::.:::: ::. CCDS10 LWVFMFVCVLGTVGLFLPPLFQTHAASEGPYAAQRD 470 480 490 >>CCDS64856.1 CHRNA2 gene_id:1135|Hs108|chr8 (514 aa) initn: 1640 init1: 1394 opt: 1394 Z-score: 1627.9 bits: 310.7 E(32554): 2.4e-84 Smith-Waterman score: 1662; 52.7% identity (73.8% similar) in 484 aa overlap (22-488:47-510) 10 20 30 40 50 pF1KE4 MLTSKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRP : . .: ::.:::..:: ::.. :: CCDS64 WWLLLTPAGGEEAKRPPPRAPGDPLSSPSPTALPQGGSHTETEDRLFKHLFRGYNRWARP 20 30 40 50 60 70 60 70 80 90 100 110 pF1KE4 VENVSDPVTVHFEVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVP : :.:: ::: ::.: ::.::.. :.::::::.: .. .: .:::: CCDS64 VPNTSD---------------VDEKNQMMTTNVWLKQEWSDYKLRWNPTDFGNITSLRVP 80 90 100 110 120 120 130 140 150 160 170 pF1KE4 ADKIWKPDIVLYNNAVGDFQVEGKTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQN .. :: ::::::::: :.: : ::: : .: . :.::::.:::: .:.::::::.:: CCDS64 SEMIWIPDIVLYNNADGEFAVTHMTKAHLFSTGTVHWVPPAIYKSSCSIDVTFFPFDQQN 130 140 150 160 170 180 180 190 200 210 220 230 pF1KE4 CSLKFGSWTYDKAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDIT :..::::::::::.::: . . ::..:.::..:: :..:.: .. ::.:: ::: :.: CCDS64 CKMKFGSWTYDKAKIDLEQMEQTVDLKDYWESGEWAIVNATGTYNSKKYDCCAEIYPDVT 190 200 210 220 230 240 240 250 260 270 280 290 pF1KE4 YSFYIRRLPMFYTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITE :.: :::::.:::::::::::.:: :::::::::::::::.:::::::::::::::.::: CCDS64 YAFVIRRLPLFYTINLIIPCLLISCLTVLVFYLPSDCGEKITLCISVLLSLTVFLLLITE 250 260 270 280 290 300 300 310 320 330 340 350 pF1KE4 TIPSTSLVVPLVGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHTMPRWVKTVFLKLLPQ :::::::.::.::::::::::::::::.::::::.:.:.:.:::::.::. ..: .:. CCDS64 IIPSTSLVIPLIGEYLLFTMIFVTLSIVITVFVLNVHHRSPSTHTMPHWVRGALLGCVPR 310 320 330 340 350 360 360 370 380 390 pF1KE4 VLLMRWP-------------LDKTRG---TGSDAVPRGLA-RRPAKGKLASHGEPRHLKE ::: : :. . .. :: : .. .. . :.: : CCDS64 WLLMNRPPPPVELCHPLRLKLSPSYHWLESNVDAEEREVVVEEEDRWACAGHVAPSVGTL 370 380 390 400 410 420 400 410 420 430 440 450 pF1KE4 CFHCHKSNELATSKRRLSHQPLQWVVENSEHSPEVEDVINSVQFIAENMKSHNETKEVED : : : . . : . : . .. ::... ....:..::....:.. . :.. CCDS64 CSHGHLHSGASGPKAEALLQEGELLL-----SPHMQKALEGVHYIADHLRSEDADSSVKE 430 440 450 460 470 460 470 480 490 pF1KE4 DWKYVAMVVDRVFLWVFIIVCVFGTAGLFLQPLLGNTGKS ::::::::.::.:::.::::: .:: :::: :.: CCDS64 DWKYVAMVIDRIFLWLFIIVCFLGTIGLFLPPFLAGMI 480 490 500 510 >>CCDS10304.1 CHRNA5 gene_id:1138|Hs108|chr15 (468 aa) initn: 1440 init1: 517 opt: 1324 Z-score: 1546.8 bits: 295.6 E(32554): 7.8e-80 Smith-Waterman score: 1411; 47.0% identity (73.3% similar) in 457 aa overlap (34-488:47-451) 10 20 30 40 50 60 pF1KE4 SKGQGFLHGGLCLWLCVFTPFFKGCVGCATEERLFHKLFSHYNQFIRPVENVSDPVTVHF :. :.. ::. :....::::...: . ..: CCDS10 VQLVAGRCGLAGAAGGAQRGLSEPSSIAKHEDSLLKDLFQDYERWVRPVEHLNDKIKIKF 20 30 40 50 60 70 70 80 90 100 110 120 pF1KE4 EVAITQLANVDEVNQIMETNLWLRHIWNDYKLRWDPMEYDGIETLRVPADKIWKPDIVLY .::.::..::: ::.: ::.::.. : : ::::.: .: ::...:::.:..: :::::. CCDS10 GLAISQLVDVDEKNQLMTTNVWLKQEWIDVKLRWNPDDYGGIKVIRVPSDSVWTPDIVLF 80 90 100 110 120 130 130 140 150 160 170 180 pF1KE4 NNAVGDFQVEG-KTKALLKYNGMITWTPPAIFKSSCPMDITFFPFDHQNCSLKFGSWTYD .:: : : :: .::....::: .:::::: .:::: .:.:::::: ::::.:::::::: CCDS10 DNADGRF--EGTSTKTVIRYNGTVTWTPPANYKSSCTIDVTFFPFDLQNCSMKFGSWTYD 140 150 160 170 180 190 190 200 210 220 230 240 pF1KE4 KAEIDLLIIGSKVDMNDFWENSEWEIIDASGYKHDIKYNCCEEIYTDITYSFYIRRLPMF ...:... . :: ::..:.::::..:.: : . .:: : .:::: :.:::.: CCDS10 GSQVDIILEDQDVDKRDFFDNGEWEIVSATGSKGNRTDSCCW--YPYVTYSFVIKRLPLF 200 210 220 230 240 250 250 260 270 280 290 300 pF1KE4 YTINLIIPCLFISFLTVLVFYLPSDCGEKVTLCISVLLSLTVFLLVITETIPSTSLVVPL ::. :::::. .::::::::::::. :::. :: :::.::::::::: : :::.: :.:: CCDS10 YTLFLIIPCIGLSFLTVLVFYLPSNEGEKICLCTSVLVSLTVFLLVIEEIIPSSSKVIPL 260 270 280 290 300 310 310 320 330 340 350 360 pF1KE4 VGEYLLFTMIFVTLSIVVTVFVLNIHYRTPTTHT-MPRWVKTVFLKLLPQVLLMRWPLDK .::::.::::::::::.::::..:::.:. .::. : :. .::. ::..: :: .:. CCDS10 IGEYLVFTMIFVTLSIMVTVFAINIHHRSSSTHNAMAPLVRKIFLHTLPKLLCMRSHVDR 320 330 340 350 360 370 370 380 390 400 410 420 pF1KE4 TRGTGSDAVPRGLARRPAKGKLASHGEPRHLKECFHCHKSNELATSKRRLSHQPLQWVVE . .: . . : . :.. : CCDS10 ----------------------------------YFTQKEETESGSGPKSSRNTL----- 380 390 430 440 450 460 470 480 pF1KE4 NSEHSPEVEDVINSVQFIAENMKSHNETKEVEDDWKYVAMVVDRVFLWVFIIVCVFGTAG : ...:...:.... ..:...:: .:::..:.:.::.:::.:..: . :. : CCDS10 --------EAALDSIRYITRHIMKENDVREVVEDWKFIAQVLDRMFLWTFLFVSIVGSLG 400 410 420 430 440 490 pF1KE4 LFLQPLLGNTGKS ::. :.. CCDS10 LFV-PVIYKWANILIPVHIGNANK 450 460 494 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 00:28:20 2016 done: Sun Nov 6 00:28:21 2016 Total Scan time: 2.930 Total Display time: 0.090 Function used was FASTA [36.3.4 Apr, 2011]