FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE2684, 217 aa 1>>>pF1KE2684 217 - 217 aa - 217 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.3096+/-0.000659; mu= 13.6794+/- 0.040 mean_var=60.9908+/-12.058, 0's: 0 Z-trim(109.9): 15 B-trim: 0 in 0/53 Lambda= 0.164226 statistics sampled from 11177 (11192) to 11177 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.721), E-opt: 0.2 (0.344), width: 16 Scan time: 1.610 The best scores are: opt bits E(32554) CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 ( 217) 1492 361.4 2.5e-100 CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 ( 237) 1454 352.4 1.4e-97 CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 ( 245) 1454 352.4 1.4e-97 CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 ( 242) 997 244.1 5.5e-65 CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 ( 248) 935 229.4 1.5e-60 CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 234) 441 112.4 2.4e-25 CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 245) 440 112.2 3e-25 CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 236) 433 110.5 9.1e-25 CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 189) 371 95.8 2e-20 CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 ( 200) 370 95.5 2.5e-20 CCDS46867.1 EIF4E3 gene_id:317649|Hs108|chr3 ( 224) 280 74.2 7.1e-14 >>CCDS34031.1 EIF4E gene_id:1977|Hs108|chr4 (217 aa) initn: 1492 init1: 1492 opt: 1492 Z-score: 1914.7 bits: 361.4 E(32554): 2.5e-100 Smith-Waterman score: 1492; 99.5% identity (100.0% similar) in 217 aa overlap (1-217:1-217) 10 20 30 40 50 60 pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE2 QRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG ::::::.::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS34 QRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIG 130 140 150 160 170 180 190 200 210 pF1KE2 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV ::::::::::::::::::::::::::::::::::::: CCDS34 RVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV 190 200 210 >>CCDS47109.1 EIF4E gene_id:1977|Hs108|chr4 (237 aa) initn: 1454 init1: 1454 opt: 1454 Z-score: 1865.4 bits: 352.4 E(32554): 1.4e-97 Smith-Waterman score: 1454; 99.5% identity (100.0% similar) in 211 aa overlap (7-217:27-237) 10 20 30 40 pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ :::::::::::::::::::::::::::::::::: CCDS47 MLDLTSRGQVGTSRRMAEAACSAHFLETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQ 10 20 30 40 50 60 50 60 70 80 90 100 pF1KE2 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 NRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEP 70 80 90 100 110 120 110 120 130 140 150 160 pF1KE2 MWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG ::::::::::::::::::::::::::.::::::::::::::::::::::::::::::::: CCDS47 MWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNVRAKG 130 140 150 160 170 180 170 180 190 200 210 pF1KE2 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV ::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV 190 200 210 220 230 >>CCDS82940.1 EIF4E gene_id:1977|Hs108|chr4 (245 aa) initn: 1454 init1: 1454 opt: 1454 Z-score: 1865.2 bits: 352.4 E(32554): 1.4e-97 Smith-Waterman score: 1454; 99.5% identity (100.0% similar) in 211 aa overlap (7-217:35-245) 10 20 30 pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK :::::::::::::::::::::::::::::: CCDS82 QNKKERKKMRAEDGENDAIKKQAESLRESQETTPTPNPPTTEEEKTESNQEVANPEHYIK 10 20 30 40 50 60 40 50 60 70 80 90 pF1KE2 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKD 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNV ::::::::::::::::::::::::::::::.::::::::::::::::::::::::::::: CCDS82 GIEPMWEDEKNKRGGRWLITLNKQQRRSDLDRFWLETLLCLIGESFDDYSDDVCGAVVNV 130 140 150 160 170 180 160 170 180 190 200 210 pF1KE2 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS82 RAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFV 190 200 210 220 230 240 pF1KE2 V : CCDS82 V >>CCDS47345.1 EIF4E1B gene_id:253314|Hs108|chr5 (242 aa) initn: 1008 init1: 990 opt: 997 Z-score: 1280.1 bits: 244.1 E(32554): 5.5e-65 Smith-Waterman score: 997; 65.1% identity (85.6% similar) in 215 aa overlap (6-217:30-242) 10 20 30 pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIK : .:: : : . ... ....: . .: CCDS47 MLAVEVSEAEGGIREWEEEEKEEEAAERTPTGEKSPNSPRTLL-SLRGKARTGGPME-VK 10 20 30 40 50 40 50 60 70 80 90 pF1KE2 ---HPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSL :::::::::::::::.:..:: ::.:..: ::::::::::.::::.:.: ::::.: CCDS47 LELHPLQNRWALWFFKNDRSRAWQDNLHLVTKVDTVEDFWALYSHIQLASKLSSGCDYAL 60 70 80 90 100 110 100 110 120 130 140 150 pF1KE2 FKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAV :::::.::::: .::::::::..: ::::. .:.:.:::::::::::::...: .::::: CCDS47 FKDGIQPMWEDSRNKRGGRWLVSLAKQQRHIELDRLWLETLLCLIGESFEEHSREVCGAV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 VNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKN ::.:.::::::.:: : ::. .: :.:::::::::: :: .::::.::::::::.: .:: CCDS47 VNIRTKGDKIAVWTREAENQAGVLHVGRVYKERLGLSPKTIIGYQAHADTATKSNSLAKN 180 190 200 210 220 230 pF1KE2 RFVV .::: CCDS47 KFVV 240 >>CCDS54779.1 EIF4E gene_id:1977|Hs108|chr4 (248 aa) initn: 1478 init1: 935 opt: 935 Z-score: 1200.6 bits: 229.4 E(32554): 1.5e-60 Smith-Waterman score: 1420; 87.1% identity (87.5% similar) in 248 aa overlap (1-217:1-248) 10 20 30 40 50 60 pF1KE2 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 MATVEPETTPTPNPPTTEEEKTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANL 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE2 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 RLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQ 70 80 90 100 110 120 130 140 pF1KE2 QRRSDLNRFWLET-------------------------------LLCLIGESFDDYSDDV ::::::.:::::: :::::::::::::::: CCDS54 QRRSDLDRFWLETRWDLAMLPRLVSNFWPQVILPLQPPKVLELQLLCLIGESFDDYSDDV 130 140 150 160 170 180 150 160 170 180 190 200 pF1KE2 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS54 CGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGS 190 200 210 220 230 240 210 pF1KE2 TTKNRFVV :::::::: CCDS54 TTKNRFVV >>CCDS63159.1 EIF4E2 gene_id:9470|Hs108|chr2 (234 aa) initn: 368 init1: 203 opt: 441 Z-score: 568.4 bits: 112.4 E(32554): 2.4e-25 Smith-Waterman score: 443; 33.8% identity (67.6% similar) in 207 aa overlap (18-213:29-229) 10 20 30 40 pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. :..:. .: CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSI-KDNSSFRNTKITL 180 190 200 210 220 230 >>CCDS2496.1 EIF4E2 gene_id:9470|Hs108|chr2 (245 aa) initn: 364 init1: 203 opt: 440 Z-score: 566.8 bits: 112.2 E(32554): 3e-25 Smith-Waterman score: 442; 32.9% identity (65.7% similar) in 210 aa overlap (18-216:29-233) 10 20 30 40 pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS24 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS24 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS24 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. : .:.. CCDS24 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKMPGRLGPQRLLFQ 180 190 200 210 220 230 CCDS24 NLWKPRLNVP 240 >>CCDS63158.1 EIF4E2 gene_id:9470|Hs108|chr2 (236 aa) initn: 364 init1: 203 opt: 433 Z-score: 558.1 bits: 110.5 E(32554): 9.1e-25 Smith-Waterman score: 435; 34.0% identity (67.5% similar) in 197 aa overlap (18-203:29-220) 10 20 30 40 pF1KE2 MATVEPETTPTPNPPTTEEEKTE--SNQEVANPEHYI----KHPLQNRW :.:::: .:: .. . . .:::: . CCDS63 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSKRKAVVPGPAEHPLQYNY 10 20 30 40 50 60 50 60 70 80 90 pF1KE2 ALWFFKND-----KSKTWQANLRLISKFDTVEDFWALYNHIQLSSNLMPGCDYSLFKDGI ..:. . .:.... :.. :. : .::.:: .:.:. ..: :. :::.:: CCDS63 TFWYSRRTPGRPTSSQSYEQNIKQIGTFASVEQFWRFYSHMVRPGDLTGHSDFHLFKEGI 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE2 EPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGESFDDYSDDVCGAVVNVRA .:::::. :: ::.:.: : :.. .: : . .: ..::.: ....:::::.:: CCDS63 KPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGEQFM-VGEEICGAVVSVRF 130 140 150 160 170 160 170 180 190 200 210 pF1KE2 KGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSHADTATKSGSTTKNRFVV . : :.::. .. ....: . .. :.:::. .. :..:.:. CCDS63 QEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTHTDSIKAWEEFHGLVNSSG 180 190 200 210 220 230 CCDS63 R >>CCDS74671.1 EIF4E2 gene_id:9470|Hs108|chr2 (189 aa) initn: 370 init1: 203 opt: 371 Z-score: 480.2 bits: 95.8 E(32554): 2e-20 Smith-Waterman score: 371; 36.2% identity (68.7% similar) in 163 aa overlap (51-213:29-184) 30 40 50 60 70 80 pF1KE2 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ .: :: . . . :: ::.:: .:.:. CCDS74 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV 10 20 30 40 50 90 100 110 120 130 140 pF1KE2 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGE ..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..:: CCDS74 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE2 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH .: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..: CCDS74 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH 120 130 140 150 160 170 210 pF1KE2 ADTATKSGSTTKNRFVV .:. :..:. .: CCDS74 TDSI-KDNSSFRNTKITL 180 >>CCDS82579.1 EIF4E2 gene_id:9470|Hs108|chr2 (200 aa) initn: 348 init1: 203 opt: 370 Z-score: 478.6 bits: 95.5 E(32554): 2.5e-20 Smith-Waterman score: 370; 34.9% identity (66.3% similar) in 166 aa overlap (51-216:29-188) 30 40 50 60 70 80 pF1KE2 KTESNQEVANPEHYIKHPLQNRWALWFFKNDKSKTWQANLRLISKFDTVEDFWALYNHIQ .: :: . . . :: ::.:: .:.:. CCDS82 MNNKFDALKDDDSGDHDQNEENSTQKDGEKEKTERDKNQSSSK-RKVEQFWRFYSHMV 10 20 30 40 50 90 100 110 120 130 140 pF1KE2 LSSNLMPGCDYSLFKDGIEPMWEDEKNKRGGRWLITLNKQQRRSDLNRFWLETLLCLIGE ..: :. :::.::.:::::. :: ::.:.: : :.. .: : . .: ..:: CCDS82 RPGDLTGHSDFHLFKEGIKPMWEDDANKNGGKWIIRL----RKGLASRCWENLILAMLGE 60 70 80 90 100 110 150 160 170 180 190 200 pF1KE2 SFDDYSDDVCGAVVNVRAKGDKIAIWTTECENREAVTHIGRVYKERLGLPPKIVIGYQSH .: ....:::::.:: . : :.::. .. ....: . .. :.:::. .. :..: CCDS82 QFM-VGEEICGAVVSVRFQEDIISIWNKTASDQATTARIRDTLRRVLNLPPNTIMEYKTH 120 130 140 150 160 170 210 pF1KE2 ADTATKSGSTTKNRFVV .:. : .:.. CCDS82 TDSIKMPGRLGPQRLLFQNLWKPRLNVP 180 190 200 217 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Apr 21 11:09:01 2017 done: Fri Apr 21 11:09:01 2017 Total Scan time: 1.610 Total Display time: 0.000 Function used was FASTA [36.3.4 Apr, 2011]