FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE4452, 470 aa 1>>>pF1KE4452 470 - 470 aa - 470 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 9.8697+/-0.00136; mu= -1.7828+/- 0.080 mean_var=329.6327+/-69.026, 0's: 0 Z-trim(108.9): 129 B-trim: 81 in 1/51 Lambda= 0.070641 statistics sampled from 10427 (10541) to 10427 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.655), E-opt: 0.2 (0.324), width: 16 Scan time: 2.590 The best scores are: opt bits E(32554) CCDS33383.1 DES gene_id:1674|Hs108|chr2 ( 470) 2947 314.5 1.5e-85 CCDS7120.1 VIM gene_id:7431|Hs108|chr10 ( 466) 1817 199.4 6.8e-51 CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 ( 470) 1664 183.8 3.4e-46 CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 ( 432) 1580 175.2 1.2e-43 CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 ( 431) 1470 164.0 2.9e-40 CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 ( 438) 1458 162.8 6.7e-40 CCDS7545.1 INA gene_id:9118|Hs108|chr10 ( 499) 1192 135.7 1.1e-31 CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 ( 543) 1150 131.5 2.2e-30 CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 ( 916) 1074 124.0 6.8e-28 CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020) 938 110.1 1.1e-23 CCDS8841.1 KRT8 gene_id:3856|Hs108|chr12 ( 483) 831 98.9 1.2e-20 CCDS58234.1 KRT8 gene_id:3856|Hs108|chr12 ( 511) 831 98.9 1.3e-20 CCDS8827.1 KRT75 gene_id:9119|Hs108|chr12 ( 551) 799 95.7 1.3e-19 CCDS8830.1 KRT5 gene_id:3852|Hs108|chr12 ( 590) 784 94.2 4e-19 CCDS8825.1 KRT84 gene_id:3890|Hs108|chr12 ( 600) 768 92.6 1.2e-18 CCDS8829.1 KRT6C gene_id:286887|Hs108|chr12 ( 564) 764 92.1 1.6e-18 CCDS8828.1 KRT6B gene_id:3854|Hs108|chr12 ( 564) 759 91.6 2.2e-18 CCDS41786.1 KRT6A gene_id:3853|Hs108|chr12 ( 564) 749 90.6 4.5e-18 CCDS41787.2 KRT4 gene_id:3851|Hs108|chr12 ( 520) 746 90.3 5.3e-18 CCDS8838.1 KRT76 gene_id:51350|Hs108|chr12 ( 638) 746 90.4 6.1e-18 CCDS8822.1 KRT7 gene_id:3855|Hs108|chr12 ( 469) 739 89.5 8.1e-18 CCDS8826.1 KRT82 gene_id:3888|Hs108|chr12 ( 513) 732 88.8 1.4e-17 CCDS8836.1 KRT1 gene_id:3848|Hs108|chr12 ( 644) 732 88.9 1.7e-17 CCDS44895.1 KRT3 gene_id:3850|Hs108|chr12 ( 628) 725 88.2 2.7e-17 CCDS8835.1 KRT2 gene_id:3849|Hs108|chr12 ( 639) 719 87.6 4.1e-17 CCDS8839.1 KRT79 gene_id:338785|Hs108|chr12 ( 535) 713 86.9 5.6e-17 CCDS41785.1 KRT86 gene_id:3892|Hs108|chr12 ( 486) 709 86.5 6.9e-17 CCDS8832.1 KRT74 gene_id:121391|Hs108|chr12 ( 529) 709 86.5 7.3e-17 CCDS8823.1 KRT83 gene_id:3889|Hs108|chr12 ( 493) 704 86.0 9.9e-17 CCDS8837.1 KRT77 gene_id:374454|Hs108|chr12 ( 578) 704 86.0 1.1e-16 CCDS31805.1 KRT81 gene_id:3887|Hs108|chr12 ( 505) 698 85.4 1.5e-16 CCDS8831.1 KRT71 gene_id:112802|Hs108|chr12 ( 523) 697 85.3 1.7e-16 CCDS8824.1 KRT85 gene_id:3891|Hs108|chr12 ( 507) 695 85.1 1.9e-16 CCDS11396.1 KRT13 gene_id:3860|Hs108|chr17 ( 458) 687 84.2 3.1e-16 CCDS8834.1 KRT73 gene_id:319101|Hs108|chr12 ( 540) 685 84.1 4e-16 CCDS8833.1 KRT72 gene_id:140807|Hs108|chr12 ( 511) 683 83.8 4.5e-16 CCDS11397.1 KRT13 gene_id:3860|Hs108|chr17 ( 420) 678 83.3 5.6e-16 CCDS11400.1 KRT14 gene_id:3861|Hs108|chr17 ( 472) 673 82.8 8.6e-16 CCDS11398.1 KRT15 gene_id:3866|Hs108|chr17 ( 456) 667 82.2 1.3e-15 CCDS8840.1 KRT78 gene_id:196374|Hs108|chr12 ( 520) 662 81.7 2e-15 CCDS11402.1 KRT17 gene_id:3872|Hs108|chr17 ( 432) 651 80.5 3.8e-15 CCDS11399.1 KRT19 gene_id:3880|Hs108|chr17 ( 400) 645 79.9 5.5e-15 CCDS11377.1 KRT10 gene_id:3858|Hs108|chr17 ( 584) 645 80.0 7.2e-15 CCDS11401.1 KRT16 gene_id:3868|Hs108|chr17 ( 473) 633 78.7 1.5e-14 CCDS31809.1 KRT18 gene_id:3875|Hs108|chr12 ( 430) 632 78.6 1.5e-14 CCDS8821.2 KRT80 gene_id:144501|Hs108|chr12 ( 452) 631 78.5 1.6e-14 CCDS41784.1 KRT80 gene_id:144501|Hs108|chr12 ( 422) 628 78.2 1.9e-14 CCDS11378.1 KRT12 gene_id:3859|Hs108|chr17 ( 494) 625 77.9 2.6e-14 CCDS11394.2 KRT35 gene_id:3886|Hs108|chr17 ( 455) 617 77.1 4.4e-14 CCDS11395.1 KRT36 gene_id:8689|Hs108|chr17 ( 467) 612 76.6 6.4e-14 >>CCDS33383.1 DES gene_id:1674|Hs108|chr2 (470 aa) initn: 2947 init1: 2947 opt: 2947 Z-score: 1649.5 bits: 314.5 E(32554): 1.5e-85 Smith-Waterman score: 2947; 100.0% identity (100.0% similar) in 470 aa overlap (1-470:1-470) 10 20 30 40 50 60 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE4 GGAGGLGSLRASRLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 GGAGGLGSLRASRLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFA 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE4 NYIEKVRFLEQQNAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 NYIEKVRFLEQQNAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVER 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE4 DNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 DNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLK 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE4 KVHEEEIRELQAQLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 KVHEEEIRELQAQLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKV 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE4 SDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE4 SGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 SGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPI 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 QTYSALNFRETSPEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL :::::::::::::::::::::::::::::::::::::::::::::::::: CCDS33 QTYSALNFRETSPEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL 430 440 450 460 470 >>CCDS7120.1 VIM gene_id:7431|Hs108|chr10 (466 aa) initn: 1836 init1: 1653 opt: 1817 Z-score: 1027.2 bits: 199.4 E(32554): 6.8e-51 Smith-Waterman score: 1817; 62.7% identity (84.7% similar) in 464 aa overlap (12-470:9-465) 10 20 30 40 50 60 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS ::::: ::: :: : : :. .. . :. : . . : CCDS71 MSTRSVSSSSYRRMFGG-PGTA-----SRPSSSRSYVTTSTRTYSLGSALRPSTSRS 10 20 30 40 50 70 80 90 100 110 pF1KE4 GGAGGLGSLRASRLGTTRTPSSYGAGELL----DFSLADAVNQEFLTTRTNEKVELQELN :.. :.. :.: ...: :: . .:: :::::::.: :: .::::::::::::: CCDS71 LYASSPGGVYATRSSAVRLRSSVPGVRLLQDSVDFSLADAINTEFKNTRTNEKVELQELN 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE4 DRFANYIEKVRFLEQQNAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARV :::::::.::::::::: : ::...:::. .:...:::::.:::::::. :::..::: CCDS71 DRFANYIDKVRFLEQQNKILLAELEQLKGQGKSRLGDLYEEEMRELRRQVDQLTNDKARV 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE4 DVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEI .:::::: .:..::. :::::. .:::::.: .:: ::: :.:::.::::..:::.::: CCDS71 EVERDNLAEDIMRLREKLQEEMLQREEAENTLQSFRQDVDNASLARLDLERKVESLQEEI 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE4 AFLKKVHEEEIRELQAQLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWY :::::.:::::.:::::.:::.::...:.:::::::::::.: :::..::::..:::::: CCDS71 AFLKKLHEEEIQELQAQIQEQHVQIDVDVSKPDLTAALRDVRQQYESVAAKNLQEAEEWY 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE4 KSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRF ::: .::..:::.::::::::::: :::.:.:: :::.:::::::.:: :::::.:. : CCDS71 KSKFADLSEAANRNNDALRQAKQESTEYRRQVQSLTCEVDALKGTNESLERQMREMEENF 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE4 ASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRI : ::..:::.:.::..::...:.::::::::::::::::::::.:::::::::::::::: CCDS71 AVEAANYQDTIGRLQDEIQNMKEEMARHLREYQDLLNVKMALDIEIATYRKLLEGEESRI 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE4 NLPIQTYSALNFRETSPEQRG-SEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL .::. ..:.::.:::. .. ..:.:.:..:::.:::::.:..: :.:.:. : CCDS71 SLPLPNFSSLNLRETNLDSLPLVDTHSKRTLLIKTVETRDGQVINE-TSQHHDDLE 420 430 440 450 460 >>CCDS8783.1 PRPH gene_id:5630|Hs108|chr12 (470 aa) initn: 1683 init1: 821 opt: 1664 Z-score: 942.8 bits: 183.8 E(32554): 3.4e-46 Smith-Waterman score: 1687; 59.9% identity (82.7% similar) in 469 aa overlap (12-470:15-462) 10 20 30 40 50 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVS .::::::: :.. :: : : .::: .: : CCDS87 MSHHPSGLRAGFSSTSYRRTFGPPPSL-------SP-----GAFSYSSSSRFSS-----S 10 20 30 40 60 70 80 90 100 110 pF1KE4 RTSGGAGGLGSLRASRLGTTRTPSSYGAGELL-------DFSLADAVNQEFLTTRTNEKV : :.:. .:.: ::. :.: . ::: :: :::.:.:.:::::.::.::: CCDS87 RLLGSASPSSSVR---LGSFRSPRA-GAGALLRLPSERLDFSMAEALNQEFLATRSNEKQ 50 60 70 80 90 120 130 140 150 160 170 pF1KE4 ELQELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLT :::::::::::.:::::::::::::: .:... .:.::.:. .: ..:::::::..:.: CCDS87 ELQELNDRFANFIEKVRFLEQQNAALRGELSQARGQEPARADQLCQQELRELRRELELLG 100 110 120 130 140 150 180 190 200 210 220 230 pF1KE4 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE .: ::.::::.: .:: :: .:.:: . .:.::.::. :: ::: :::.:..:::.:: CCDS87 RERDRVQVERDGLAEDLAALKQRLEEETRKREDAEHNLVLFRKDVDDATLSRLELERKIE 160 170 180 190 200 210 240 250 260 270 280 pF1KE4 SLNEEIAFLKKVHEEEIRELQAQLQEQQVQ-VEMDMS-KPDLTAALRDIRAQYETIAAKN :: .:: ::::.::::.:.::.... :::: ::.. . ::.:::::::::::::.::::: CCDS87 SLMDEIEFLKKLHEEELRDLQVSVESQQVQQVEVEATVKPELTAALRDIRAQYESIAAKN 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE4 ISEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQ ..::::::::: .::..:::.:..::::::::: : :.:::: :::.:.:.:::..:.:: CCDS87 LQEAEEWYKSKYADLSDAANRNHEALRQAKQEMNESRRQIQSLTCEVDGLRGTNEALLRQ 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE4 MRELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKL .::::..:: ::.::: . ::::::.:.::.::::::::::.:::::::::.:::::::: CCDS87 LRELEEQFALEAGGYQAGAARLEEELRQLKEEMARHLREYQELLNVKMALDIEIATYRKL 340 350 360 370 380 390 410 420 430 440 450 460 pF1KE4 LEGEESRINLPIQTYSALNFRETSPE-QRGSEVHTKKTVMIKTIETRDGEVVSEATQQQH ::::::::..:......::.. : :: . .. :..:::.:::::::.::::.:. ..:. CCDS87 LEGEESRISVPVHSFASLNIKTTVPEVEPPQDSHSRKTVLIKTIETRNGEVVTESQKEQR 400 410 420 430 440 450 470 pF1KE4 EVL : CCDS87 SELDKSSAHSY 460 470 >>CCDS11491.1 GFAP gene_id:2670|Hs108|chr17 (432 aa) initn: 1559 init1: 1455 opt: 1580 Z-score: 897.0 bits: 175.2 E(32554): 1.2e-43 Smith-Waterman score: 1580; 58.0% identity (84.1% similar) in 429 aa overlap (47-470:7-432) 20 30 40 50 60 70 pF1KE4 TFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTSGGAGGLGSLR----AS .:.. : : :: .:::. : .. CCDS11 MERRRITSAARRSY-VSSGEMMVGGLAPGRRLGPGT 10 20 30 80 90 100 110 120 130 pF1KE4 RLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFANYIEKVRFLEQQ ::. .: : . .::::: :.: : ::..:..:..:::::::.::::::::::: CCDS11 RLSLARMPPPLPTR--VDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE4 NAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVERDNLLDDLQRLKA : :::::.:.:...:::..:..:. :::::: ... :: . ::..:::::: .:: .. CCDS11 NKALAAELNQLRAKEPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQ 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE4 KLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLKKVHEEEIRELQA :::.: .:. ::::::::.: ..: :::::.::::.::::.::: ::.:.::::.:::: CCDS11 KLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE4 QLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKVSDLTQAANKNND :: .:::.::.:..::::::::..::.:::..:..:. ::::::.:: .:::.:: .: . CCDS11 QLARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAE 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE4 ALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEASGYQDNIARLEE :::::.: .::.:.:: ::....:.:::.:: ::::: :.: . ::..::. .::::: CCDS11 LLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEE 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE4 EIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPIQTYSALNFRETS : . :::::::::.:::::::::.:::.:::::::::::::.::..:.::.: :..:::: CCDS11 EGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRETS 340 350 360 370 380 390 440 450 460 470 pF1KE4 PEQRG-SEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL . .. :: : :.....::.: :::::..:. :....:. CCDS11 LDTKSVSEGHLKRNIVVKTVEMRDGEVIKESKQEHKDVM 400 410 420 430 >>CCDS45708.1 GFAP gene_id:2670|Hs108|chr17 (431 aa) initn: 1440 init1: 1440 opt: 1470 Z-score: 836.5 bits: 164.0 E(32554): 2.9e-40 Smith-Waterman score: 1470; 57.8% identity (82.3% similar) in 412 aa overlap (47-454:7-413) 20 30 40 50 60 70 pF1KE4 TFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTSGGAGGLGSLR----AS .:.. : : :: .:::. : .. CCDS45 MERRRITSAARRSY-VSSGEMMVGGLAPGRRLGPGT 10 20 30 80 90 100 110 120 130 pF1KE4 RLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFANYIEKVRFLEQQ ::. .: : . .::::: :.: : ::..:..:..:::::::.::::::::::: CCDS45 RLSLARMPPPLPT--RVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE4 NAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVERDNLLDDLQRLKA : :::::.:.:...:::..:..:. :::::: ... :: . ::..:::::: .:: .. CCDS45 NKALAAELNQLRAKEPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQ 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE4 KLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLKKVHEEEIRELQA :::.: .:. ::::::::.: ..: :::::.::::.::::.::: ::.:.::::.:::: CCDS45 KLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE4 QLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKVSDLTQAANKNND :: .:::.::.:..::::::::..::.:::..:..:. ::::::.:: .:::.:: .: . CCDS45 QLARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAE 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE4 ALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEASGYQDNIARLEE :::::.: .::.:.:: ::....:.:::.:: ::::: :.: . ::..::. .::::: CCDS45 LLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEE 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE4 EIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPIQTYSALNFRETS : . :::::::::.:::::::::.:::.:::::::::::::.::..:.::.: :..: . CCDS45 EGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRGGK 340 350 360 370 380 390 440 450 460 470 pF1KE4 PEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL . : : : : : ..:.. : CCDS45 STKDG-ENH-KVTRYLKSLTIRVIPIQAHQIVNGTPPARG 400 410 420 430 >>CCDS59296.1 GFAP gene_id:2670|Hs108|chr17 (438 aa) initn: 1534 init1: 1438 opt: 1458 Z-score: 829.8 bits: 162.8 E(32554): 6.7e-40 Smith-Waterman score: 1458; 59.7% identity (84.2% similar) in 387 aa overlap (47-429:7-390) 20 30 40 50 60 70 pF1KE4 TFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTSGGAGGLGSLR----AS .:.. : : :: .:::. : .. CCDS59 MERRRITSAARRSY-VSSGEMMVGGLAPGRRLGPGT 10 20 30 80 90 100 110 120 130 pF1KE4 RLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFANYIEKVRFLEQQ ::. .: : . .::::: :.: : ::..:..:..:::::::.::::::::::: CCDS59 RLSLARMPPPLPT--RVDFSLAGALNAGFKETRASERAEMMELNDRFASYIEKVRFLEQQ 40 50 60 70 80 90 140 150 160 170 180 190 pF1KE4 NAALAAEVNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVERDNLLDDLQRLKA : :::::.:.:...:::..:..:. :::::: ... :: . ::..:::::: .:: .. CCDS59 NKALAAELNQLRAKEPTKLADVYQAELRELRLRLDQLTANSARLEVERDNLAQDLATVRQ 100 110 120 130 140 150 200 210 220 230 240 250 pF1KE4 KLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLKKVHEEEIRELQA :::.: .:. ::::::::.: ..: :::::.::::.::::.::: ::.:.::::.:::: CCDS59 KLQDETNLRLEAENNLAAYRQEADEATLARLDLERKIESLEEEIRFLRKIHEEEVRELQE 160 170 180 190 200 210 260 270 280 290 300 310 pF1KE4 QLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKVSDLTQAANKNND :: .:::.::.:..::::::::..::.:::..:..:. ::::::.:: .:::.:: .: . CCDS59 QLARQQVHVELDVAKPDLTAALKEIRTQYEAMASSNMHEAEEWYRSKFADLTDAAARNAE 220 230 240 250 260 270 320 330 340 350 360 370 pF1KE4 ALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEASGYQDNIARLEE :::::.: .::.:.:: ::....:.:::.:: ::::: :.: . ::..::. .::::: CCDS59 LLRQAKHEANDYRRQLQSLTCDLESLRGTNESLERQMREQEERHVREAASYQEALARLEE 280 290 300 310 320 330 380 390 400 410 420 430 pF1KE4 EIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPIQTYSALNFRETS : . :::::::::.:::::::::.:::.:::::::::::::.::..:.::.: :..: CCDS59 EGQSLKDEMARHLQEYQDLLNVKLALDIEIATYRKLLEGEENRITIPVQTFSNLQIRGQY 340 350 360 370 380 390 440 450 460 470 pF1KE4 PEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL CCDS59 SRASWEGHWSPAPSSRACRLLQTGTEDQGKGIQLSLGAFVTLQRS 400 410 420 430 >>CCDS7545.1 INA gene_id:9118|Hs108|chr10 (499 aa) initn: 1070 init1: 657 opt: 1192 Z-score: 682.5 bits: 135.7 E(32554): 1.1e-31 Smith-Waterman score: 1211; 50.2% identity (77.0% similar) in 422 aa overlap (12-427:13-418) 10 20 30 40 50 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRT ::::..:: :: ::. . .: :. :.: : : . . CCDS75 MSFGSEHYLCSSSSYRKVFGD------GSRLSARLSGAGGAGGFRSQSLSRSNVASSAAC 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 SGGAG-GLGSLRASRLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDR :.... ::: :. : :.: : ::.: : : ..:. ::::: .:: :::: CCDS75 SSASSLGLG------LAYRRPPASDG----LDLSQAAARTNEYKIIRTNEKEQLQGLNDR 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 FANYIEKVRFLEQQNAALAAEVNRLKGR--EPTRVAELYEEELRELRRQVEVLTNQRARV :: .::::. :: :: :: ::. :. : ::.::.::...:::.:: :.: .. :... CCDS75 FAVFIEKVHQLETQNRALEAELAALRQRHAEPSRVGELFQRELRDLRAQLEEASSARSQA 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 DVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEI .:::.: ...:::.:. .:: . .: :: : : . :::.:::::.:::...::: .:. CCDS75 LLERDGLAEEVQRLRARCEEESRGREGAERALKAQQRDVDGATLARLDLEKKVESLLDEL 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE4 AFLKKVHEEEIRELQAQLQEQ-QVQVEMDMS--KPDLTAALRDIRAQYETIAAKNISEAE ::...::.::. :: : :: . :. .:.:.. :::::.:::.::::::..::::.. :: CCDS75 AFVRQVHDEEVAELLATLQASSQAAAEVDVTVAKPDLTSALREIRAQYESLAAKNLQSAE 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE4 EWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELE :::::: ..:.. : ....:.: ...:. :::.:.:. : ::..:.:.:.:: ::. ::: CCDS75 EWYKSKFANLNEQAARSTEAIRASREEIHEYRRQLQARTIEIEGLRGANESLERQILELE 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE4 DRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEE .: ..:..::::.:..::...:. :.::::::::::::::::::::.:::.::::::::: CCDS75 ERHSAEVAGYQDSIGQLENDLRNTKSEMARHLREYQDLLNVKMALDIEIAAYRKLLEGEE 350 360 370 380 390 400 420 430 440 450 460 470 pF1KE4 SRINLPIQTYSALNFRETSPEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL .:.. . :.:: CCDS75 TRFSTSGLSISGLNPLPNPSYLLPPRILSATTSKVSSTGLSLKKEEEEEEASKVASKKTS 410 420 430 440 450 460 >>CCDS75712.1 NEFL gene_id:4747|Hs108|chr8 (543 aa) initn: 1227 init1: 961 opt: 1150 Z-score: 658.9 bits: 131.5 E(32554): 2.2e-30 Smith-Waterman score: 1150; 49.9% identity (78.2% similar) in 385 aa overlap (36-418:22-402) 10 20 30 40 50 60 pF1KE4 SSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTSGGAGG ::. ..: :. :.. .: .: .: CCDS75 MSSFSYEPYYSTSYKRRYVETPRVHISSVRSGYSTARSAY----SSYSAPV 10 20 30 40 70 80 90 100 110 120 pF1KE4 LGSLRASRLGTTRTPSSYGAGELLDFSLADAVNQEFLTTRTNEKVELQELNDRFANYIEK .:: . : .. . : . . : ::.: . :..... . ::.::..::.::::::..::. CCDS75 SSSLSVRRSYSSSSGSLMPSLENLDLSQVAAISNDLKSIRTQEKAQLQDLNDRFASFIER 50 60 70 80 90 100 130 140 150 160 170 180 pF1KE4 VRFLEQQNAALAAE--VNRLKGREPTRVAELYEEELRELRRQVEVLTNQRARVDVERDNL :. ::::: .: :: : : : ::.: :::.:.:.:: .: ::.. .. ::..: CCDS75 VHELEQQNKVLEAELLVLRQKHSEPSRFRALYEQEIRDLRLAAEDATNEKQALQGEREGL 110 120 130 140 150 160 190 200 210 220 230 240 pF1KE4 LDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIESLNEEIAFLKKVH . :. :.:. .::. .:.::. : : .: :.::: .::.::.:: .::.:::::: CCDS75 EETLRNLQARYEEEVLSREDAEGRLMEARKGADEAALARAELEKRIDSLMDEISFLKKVH 170 180 190 200 210 220 250 260 270 280 290 300 pF1KE4 EEEIRELQAQLQEQQVQVEMDMSKPDLTAALRDIRAQYETIAAKNISEAEEWYKSKVSDL :::: :::::.: :..::::..::::.:::.::::::: .::::...::::.::. . : CCDS75 EEEIAELQAQIQYAQISVEMDVTKPDLSAALKDIRAQYEKLAAKNMQNAEEWFKSRFTVL 230 240 250 260 270 280 310 320 330 340 350 360 pF1KE4 TQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQMRELEDRFASEASGY :..: ::.::.: ::.:. : :. ... : ::.: .: :..: .:..::::. .. :.. CCDS75 TESAAKNTDAVRAAKDEVSESRRLLKAKTLEIEACRGMNEALEKQLQELEDKQNADISAM 290 300 310 320 330 340 370 380 390 400 410 420 pF1KE4 QDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLLEGEESRINLPIQTY ::.: .::.:.: :.::::.:.:::::::::::::.:::.:::::::::.:... CCDS75 QDTINKLENELRTTKSEMARYLKEYQDLLNVKMALDIEIAAYRKLLEGEETRLSFTSVGS 350 360 370 380 390 400 430 440 450 460 470 pF1KE4 SALNFRETSPEQRGSEVHTKKTVMIKTIETRDGEVVSEATQQQHEVL CCDS75 ITSGYSQSSQVFGRSAYGGLQTSSYLMSTRSFPSYYTSHVQEEQIEVEETIEAAKAEEAK 410 420 430 440 450 460 >>CCDS6046.1 NEFM gene_id:4741|Hs108|chr8 (916 aa) initn: 1028 init1: 542 opt: 1074 Z-score: 614.2 bits: 124.0 E(32554): 6.8e-28 Smith-Waterman score: 1075; 38.8% identity (73.1% similar) in 469 aa overlap (6-468:12-465) 10 20 30 40 50 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVY :. .::. : .:. . : : .: . : . : :: .. :: .: . CCDS60 MSYTLDSLGNPSAYRRVTETRSSFSRVSGSP-SSGFRSQSWSR---GSPSTVSSSYKRSM 10 20 30 40 50 60 70 80 90 100 110 pF1KE4 QVSRTSGGAGGLGSLRASRLGTTRTPS--SYGAGELLDFSLADAVNQEFLTTRTNEKVEL . : . ... :.: ..: : ... : . :.: :..: .:.::: .: CCDS60 LAPRLAYSSAMLSSAESS-LDFSQSSSLLNGGSGPGGDYKL----------SRSNEKEQL 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 QELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPT--RVAELYEEELRELRRQVEVLT : ::::::.:::::..::::: . ::.. :. .. . .... :..:.:::: .:... CCDS60 QGLNDRFAGYIEKVHYLEQQNKEIEAEIQALRQKQASHAQLGDAYDQEIRELRATLEMVN 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE ...:.:... :.: .:..::: ...:: .:....: . :.: :.. :.:....:..... CCDS60 HEKAQVQLDSDHLEEDIHRLKERFEEEARLRDDTEAAIRALRKDIEEASLVKVELDKKVQ 170 180 190 200 210 220 240 250 260 270 280 pF1KE4 SLNEEIAFLKKVHEEEIRELQAQLQEQQVQVEM-DMSKPDLTAALRDIRAQYETIAAKNI ::..:.:::.. ::::. .: ::.: ... :: :. : :...::..::.: :. . .:. CCDS60 SLQDEVAFLRSNHEEEVADLLAQIQASHITVERKDYLKTDISTALKEIRSQLESHSDQNM 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 SEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDSLMRQM .::::.: . . ::.::..:..:.:.::.:. :::.:.:: . :.....::..:: ::. CCDS60 HQAEEWFKCRYAKLTEAAEQNKEAIRSAKEEIAEYRRQLQSKSIELESVRGTKESLERQL 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 RELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIATYRKLL ..:.: . :.:::.: .::.:.: : ::::::::::::::::::::.:::.::::: CCDS60 SDIEERHNHDLSSYQDTIQQLENELRGTKWEMARHLREYQDLLNVKMALDIEIAAYRKLL 350 360 370 380 390 400 410 420 430 440 450 460 pF1KE4 EGEESRINLPIQTYSALNFRETSPEQRGSEVHTKKTVMIKT-IETRDGEVVSEATQQQHE ::::.:.. . .. . . : .:... :. : .. . : . : :. . : CCDS60 EGEETRFSTFAGSITGPLYTHRPPITISSKIQKPKVEAPKLKVQHKFVEEIIEETKVEDE 410 420 430 440 450 460 470 pF1KE4 VL CCDS60 KSEMEEALTAITEELAVSMKEEKKEAAEEKEEEPEAEEEEVAAKKSPVKATAPEVKEEEG 470 480 490 500 510 520 >>CCDS13858.1 NEFH gene_id:4744|Hs108|chr22 (1020 aa) initn: 926 init1: 520 opt: 938 Z-score: 538.8 bits: 110.1 E(32554): 1.1e-23 Smith-Waterman score: 953; 39.2% identity (69.4% similar) in 477 aa overlap (17-469:3-470) 10 20 30 40 50 60 pF1KE4 MSQAYSSSQRVSSYRRTFGGAPGFPLGSPLSSPVFPRAGFGSKGSSSSVTSRVYQVSRTS .:::: .. ::.:.. : : :: . . . . . .. CCDS13 MMSFGGADAL-LGAPFA----PLHGGGSLHYALARKGGAGGTRSAA 10 20 30 40 70 80 90 100 110 pF1KE4 GGAGGLGS-LRASRLGTTRTPSSY-GAGELLDFSLADAVNQE------FLTTRTNEKVEL :...:. : :.: ... .:: . ::: . . :.... ..: .:: .: CCDS13 GSSSGFHSWTRTSVSSVSASPSRFRGAGAASSTDSLDTLSNGPEGCMVAVATSRSEKEQL 50 60 70 80 90 100 120 130 140 150 160 170 pF1KE4 QELNDRFANYIEKVRFLEQQNAALAAEVNRLKGREPTRVA--ELYEEELRELRRQVEVLT : ::::::.::.::: :: .: .: .:. :. .. : : ::::.:.::.: : : CCDS13 QALNDRFAGYIDKVRQLEAHNRSLEGEAAALRQQQAGRSAMGELYEREVREMRGAVLRLG 110 120 130 140 150 160 180 190 200 210 220 230 pF1KE4 NQRARVDVERDNLLDDLQRLKAKLQEEIQLKEEAENNLAAFRADVDAATLARIDLERRIE :... .:...::.:. ... .:..: . .:::: :. .. : ::.::... . CCDS13 AARGQLRLEQEHLLEDIAHVRQRLDDEARQREEAEAAARALARFAQEAEAARVDLQKKAQ 170 180 190 200 210 220 240 250 260 270 280 pF1KE4 SLNEEIAFLKKVHEEEIRELQAQLQ-----EQQVQVEM-DMSKPDLTAALRDIRAQYETI .:.:: ..:.. :.::. :: .:.: . :.:.: : : :.:.:::.:::: : CCDS13 ALQEECGYLRRHHQEEVGELLGQIQGSGAAQAQMQAETRDALKCDVTSALREIRAQLEGH 230 240 250 260 270 280 290 300 310 320 330 340 pF1KE4 AAKNISEAEEWYKSKVSDLTQAANKNNDALRQAKQEMMEYRHQIQSYTCEIDALKGTNDS :... ..:::.. ... :..::. :.::.:.:..:. :::.:.:. : :..:::.:.:: CCDS13 AVQSTLQSEEWFRVRLDRLSEAAKVNTDAMRSAQEEITEYRRQLQARTTELEALKSTKDS 290 300 310 320 330 340 350 360 370 380 390 400 pF1KE4 LMRQMRELEDRFASEASGYQDNIARLEEEIRHLKDEMARHLREYQDLLNVKMALDVEIAT : :: ::::: .. ..::. : .:. :.:. : ::: .:::::::::::::::.:::. CCDS13 LERQRSELEDRHQADIASYQEAIQQLDAELRNTKWEMAAQLREYQDLLNVKMALDIEIAA 350 360 370 380 390 400 410 420 430 440 450 pF1KE4 YRKLLEGEESRINL-PIQTYSALNFRETSPE--QRGSEVHTKKTVMIKTIETRDGEVV-- ::::::::: ::.. :: ... : :. . ......:. ::..: . :.: CCDS13 YRKLLEGEECRIGFGPIP----FSLPEGLPKIPSVSTHIKVKSEEKIKVVEKSEKETVIV 410 420 430 440 450 460 470 pF1KE4 ---SEATQQQHEVL .: :: .:: CCDS13 EEQTEETQVTEEVTEEEEKEAKEEEGKEEEGGEEEEAEGGEEETKSPPAEEAASPEKEAK 460 470 480 490 500 510 470 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 01:02:28 2016 done: Sun Nov 6 01:02:28 2016 Total Scan time: 2.590 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]