FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE6459, 453 aa 1>>>pF1KE6459 453 - 453 aa - 453 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 6.5033+/-0.000736; mu= 13.1067+/- 0.045 mean_var=96.7803+/-19.770, 0's: 0 Z-trim(111.5): 26 B-trim: 488 in 1/52 Lambda= 0.130371 statistics sampled from 12441 (12466) to 12441 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.73), E-opt: 0.2 (0.383), width: 16 Scan time: 2.180 The best scores are: opt bits E(32554) CCDS5685.1 AP4M1 gene_id:9179|Hs108|chr7 ( 453) 2996 573.4 1.6e-163 CCDS43177.1 AP2M1 gene_id:1173|Hs108|chr3 ( 435) 559 115.0 1.5e-25 CCDS43178.1 AP2M1 gene_id:1173|Hs108|chr3 ( 433) 515 106.8 4.6e-23 CCDS82880.1 AP2M1 gene_id:1173|Hs108|chr3 ( 460) 515 106.8 4.9e-23 CCDS46008.1 AP1M1 gene_id:8907|Hs108|chr19 ( 435) 409 86.8 4.6e-17 >>CCDS5685.1 AP4M1 gene_id:9179|Hs108|chr7 (453 aa) initn: 2996 init1: 2996 opt: 2996 Z-score: 3049.2 bits: 573.4 E(32554): 1.6e-163 Smith-Waterman score: 2996; 100.0% identity (100.0% similar) in 453 aa overlap (1-453:1-453) 10 20 30 40 50 60 pF1KE6 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTGLPGDESPVVMHHHGRHFIHIR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTGLPGDESPVVMHHHGRHFIHIR 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE6 HSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGSLGEGTISRNVALVYELLDEVLDYG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 HSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGSLGEGTISRNVALVYELLDEVLDYG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE6 YVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFGAETQQSKVAPSSAASRPVLSSRSD :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 YVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFGAETQQSKVAPSSAASRPVLSSRSD 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE6 QSQKNEVFLDVVERLSVLIASNGSLLKVDVQGEIRLKSFLPSGSEMRIGLTEEFCVGKSE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 QSQKNEVFLDVVERLSVLIASNGSLLKVDVQGEIRLKSFLPSGSEMRIGLTEEFCVGKSE 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE6 LRGYGPGIRVDEVSFHSSVNLDEFESHRILRLQPPQGELTVMRYQLSDDLPSPLPFRLFP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LRGYGPGIRVDEVSFHSSVNLDEFESHRILRLQPPQGELTVMRYQLSDDLPSPLPFRLFP 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE6 SVQWDRGSGRLQVYLKLRCDLLSKSQALNVRLHLPLPRGVVSLSQELSSPEQKAELAEGA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 SVQWDRGSGRLQVYLKLRCDLLSKSQALNVRLHLPLPRGVVSLSQELSSPEQKAELAEGA 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE6 LRWDLPRVQGGSQLSGLFQMDVPGPPGPPSHGLSTSASPLGLGPASLSFELPRHTCSGLQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS56 LRWDLPRVQGGSQLSGLFQMDVPGPPGPPSHGLSTSASPLGLGPASLSFELPRHTCSGLQ 370 380 390 400 410 420 430 440 450 pF1KE6 VRFLRLAFRPCGNANPHKWVRHLSHSDAYVIRI ::::::::::::::::::::::::::::::::: CCDS56 VRFLRLAFRPCGNANPHKWVRHLSHSDAYVIRI 430 440 450 >>CCDS43177.1 AP2M1 gene_id:1173|Hs108|chr3 (435 aa) initn: 474 init1: 136 opt: 559 Z-score: 572.2 bits: 115.0 E(32554): 1.5e-25 Smith-Waterman score: 643; 28.9% identity (63.4% similar) in 464 aa overlap (1-452:1-434) 10 20 30 40 50 60 pF1KE6 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTGLPGDESPVVMHHHGRHFIHIR ::. .:: . ::. :: . .: : : :.... : .. . : . :.:.. CCDS43 MIGGLFIYNHKGEVLISRVYRDDIG-RNAVDAFRVNVIHARQQVRSPVTNIARTSFFHVK 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 HSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGSLGEGTISRNVALVYELLDEVLDYG .:...:...:..::. ..:.: .. ... : :...: .:. : .:.::::::.::.: CCDS43 RSNIWLAAVTKQNVNAAMVFEFLYKMCDVMAAYFGKISEENIKNNFVLIYELLDEILDFG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 YVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFGAETQQSKVAPSSAASRPVLSSRSD : :.. : :..:: ... :. . . :.. :.:. . . : .. : CCDS43 YPQNSETGALKTFITQQGIKSQHQTKEEQSQI--------TSQVTGQIGWRREGIKYR-- 120 130 140 150 160 190 200 210 220 230 pF1KE6 QSQKNEVFLDVVERLSVLIASNGSLLKVDVQGEIRLKSFLPSGSEMRIGLTEEFCV---G .::.::::.: ...:.. .:..:.. :.:.. .::.: . : ..:..... . : CCDS43 ---RNELFLDVLESVNLLMSPQGQVLSAHVSGRVVMKSYLSGMPECKFGMNDKIVIEKQG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 KS---ELRGYGP-GIRVDEVSFHSSVNLDEFESHRILRLQPPQGELTVMRYQLSDDLPSP :. : : .: .:. .::. : :..:.:.: . . ::.::. .:::. . :. CCDS43 KGTADETSKSGKQSIAIDDCTFHQCVRLSKFDSERSISFIPPDGEFELMRYRTTKDI--I 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 LPFRLFPSVQWDRGSGRLQVYLKLRCDLLSKSQALNVRLHLPLPRGVVSLSQELSSPEQK ::::..: :. . : .:.: . .. .. . : ......: : .. ... . . : CCDS43 LPFRVIPLVR-EVGRTKLEVKVVIKSNFKPSLLAQKIEVRIPTPLNTSGVQVICMKGKAK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 AELAEGALRWDLPRVQGG--SQLSGLFQMDVPGPPGPPSHGLSTSASPLGLGPASLSFEL . .:.:. : . :. : ::.:. ... :.. . : : : :..::. CCDS43 YKASENAIVWKIKRMAGMKESQISAEIELL-------PTNDKKKWARP----PISMNFEV 350 360 370 380 390 420 430 440 450 pF1KE6 PRHTCSGLQVRFLRLAFRPCGNANPH---KWVRHLSHSDAYVIRI : . :::.::.:.. :.: : . : ::::....: : : CCDS43 P-FAPSGLKVRYLKV-FEPKLNYSDHDVIKWVRYIGRSGIYETRC 400 410 420 430 >>CCDS43178.1 AP2M1 gene_id:1173|Hs108|chr3 (433 aa) initn: 474 init1: 136 opt: 515 Z-score: 527.5 bits: 106.8 E(32554): 4.6e-23 Smith-Waterman score: 641; 28.4% identity (64.0% similar) in 464 aa overlap (1-452:1-432) 10 20 30 40 50 60 pF1KE6 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTGLPGDESPVVMHHHGRHFIHIR ::. .:: . ::. :: . .: : : :.... : .. . : . :.:.. CCDS43 MIGGLFIYNHKGEVLISRVYRDDIG-RNAVDAFRVNVIHARQQVRSPVTNIARTSFFHVK 10 20 30 40 50 70 80 90 100 110 120 pF1KE6 HSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGSLGEGTISRNVALVYELLDEVLDYG .:...:...:..::. ..:.: .. ... : :...: .:. : .:.::::::.::.: CCDS43 RSNIWLAAVTKQNVNAAMVFEFLYKMCDVMAAYFGKISEENIKNNFVLIYELLDEILDFG 60 70 80 90 100 110 130 140 150 160 170 180 pF1KE6 YVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFGAETQQSKVAPSSAASRPVLSSRSD : :.. : :..:: ... :. .. .::... :..... .. CCDS43 YPQNSETGALKTFITQQGIKSQ--------------TKEEQSQIT-SQVTGQIGWRREGI 120 130 140 150 160 190 200 210 220 230 pF1KE6 QSQKNEVFLDVVERLSVLIASNGSLLKVDVQGEIRLKSFLPSGSEMRIGLTEEFCV---G . ..::.::::.: ...:.. .:..:.. :.:.. .::.: . : ..:..... . : CCDS43 KYRRNELFLDVLESVNLLMSPQGQVLSAHVSGRVVMKSYLSGMPECKFGMNDKIVIEKQG 170 180 190 200 210 220 240 250 260 270 280 290 pF1KE6 KS---ELRGYGP-GIRVDEVSFHSSVNLDEFESHRILRLQPPQGELTVMRYQLSDDLPSP :. : : .: .:. .::. : :..:.:.: . . ::.::. .:::. . :. CCDS43 KGTADETSKSGKQSIAIDDCTFHQCVRLSKFDSERSISFIPPDGEFELMRYRTTKDI--I 230 240 250 260 270 280 300 310 320 330 340 350 pF1KE6 LPFRLFPSVQWDRGSGRLQVYLKLRCDLLSKSQALNVRLHLPLPRGVVSLSQELSSPEQK ::::..: :. . : .:.: . .. .. . : ......: : .. ... . . : CCDS43 LPFRVIPLVR-EVGRTKLEVKVVIKSNFKPSLLAQKIEVRIPTPLNTSGVQVICMKGKAK 290 300 310 320 330 340 360 370 380 390 400 410 pF1KE6 AELAEGALRWDLPRVQGG--SQLSGLFQMDVPGPPGPPSHGLSTSASPLGLGPASLSFEL . .:.:. : . :. : ::.:. ... :.. . : : : :..::. CCDS43 YKASENAIVWKIKRMAGMKESQISAEIELL-------PTNDKKKWARP----PISMNFEV 350 360 370 380 390 420 430 440 450 pF1KE6 PRHTCSGLQVRFLRLAFRPCGNANPH---KWVRHLSHSDAYVIRI : . :::.::.:.. :.: : . : ::::....: : : CCDS43 P-FAPSGLKVRYLKV-FEPKLNYSDHDVIKWVRYIGRSGIYETRC 400 410 420 430 >>CCDS82880.1 AP2M1 gene_id:1173|Hs108|chr3 (460 aa) initn: 488 init1: 136 opt: 515 Z-score: 527.1 bits: 106.8 E(32554): 4.9e-23 Smith-Waterman score: 628; 28.5% identity (62.1% similar) in 488 aa overlap (1-452:1-459) 10 20 30 40 pF1KE6 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTG-LPGD----------ESPVVM ::. .:: . ::. :: . .: : :.:..:. . .: .::. .. : CCDS82 MIGGLFIYNHKGEVLISRVYRDDIGSRQAADSAVFSSSGPFPGEWLEANRRNAVDAFRVN 10 20 30 40 50 60 50 60 70 80 90 pF1KE6 HHHGRH-------------FIHIRHSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGS :.:. :.:...:...:...:..::. ..:.: .. ... : :. CCDS82 VIHARQQVRSPVTNIARTSFFHVKRSNIWLAAVTKQNVNAAMVFEFLYKMCDVMAAYFGK 70 80 90 100 110 120 100 110 120 130 140 150 pF1KE6 LGEGTISRNVALVYELLDEVLDYGYVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFG ..: .:. : .:.::::::.::.:: :.. : :..:: ... :. . . :.. CCDS82 ISEENIKNNFVLIYELLDEILDFGYPQNSETGALKTFITQQGIKSQHQTKEEQSQI---- 130 140 150 160 170 160 170 180 190 200 210 pF1KE6 AETQQSKVAPSSAASRPVLSSRSDQSQKNEVFLDVVERLSVLIASNGSLLKVDVQGEIRL :.:. . . : .. : .::.::::.: ...:.. .:..:.. :.:.. . CCDS82 ----TSQVTGQIGWRREGIKYR-----RNELFLDVLESVNLLMSPQGQVLSAHVSGRVVM 180 190 200 210 220 220 230 240 250 260 pF1KE6 KSFLPSGSEMRIGLTEEFCV---GKS---ELRGYGP-GIRVDEVSFHSSVNLDEFESHRI ::.: . : ..:..... . ::. : : .: .:. .::. : :..:.:.: CCDS82 KSYLSGMPECKFGMNDKIVIEKQGKGTADETSKSGKQSIAIDDCTFHQCVRLSKFDSERS 230 240 250 260 270 280 270 280 290 300 310 320 pF1KE6 LRLQPPQGELTVMRYQLSDDLPSPLPFRLFPSVQWDRGSGRLQVYLKLRCDLLSKSQALN . . ::.::. .:::. . :. ::::..: :. . : .:.: . .. .. . : . CCDS82 ISFIPPDGEFELMRYRTTKDI--ILPFRVIPLVR-EVGRTKLEVKVVIKSNFKPSLLAQK 290 300 310 320 330 340 330 340 350 360 370 380 pF1KE6 VRLHLPLPRGVVSLSQELSSPEQKAELAEGALRWDLPRVQGG--SQLSGLFQMDVPGPPG .....: : .. ... . . : . .:.:. : . :. : ::.:. ... CCDS82 IEVRIPTPLNTSGVQVICMKGKAKYKASENAIVWKIKRMAGMKESQISAEIELL------ 350 360 370 380 390 390 400 410 420 430 440 pF1KE6 PPSHGLSTSASPLGLGPASLSFELPRHTCSGLQVRFLRLAFRPCGNANPH---KWVRHLS :.. . : : : :..::.: . :::.::.:.. :.: : . : ::::... CCDS82 -PTNDKKKWARP----PISMNFEVP-FAPSGLKVRYLKV-FEPKLNYSDHDVIKWVRYIG 400 410 420 430 440 450 450 pF1KE6 HSDAYVIRI .: : : CCDS82 RSGIYETRC 460 >>CCDS46008.1 AP1M1 gene_id:8907|Hs108|chr19 (435 aa) initn: 586 init1: 251 opt: 409 Z-score: 419.7 bits: 86.8 E(32554): 4.6e-17 Smith-Waterman score: 618; 28.1% identity (59.9% similar) in 466 aa overlap (3-452:4-433) 10 20 30 40 50 pF1KE6 MISQFFILSSKGDPLIYKDFRGDSGGRDVAELFYRKLTGLP--GDESPVVMHHHGRHFI : ..:. :: :: ...::: .: : :. : : ::. . : : .:. CCDS46 MSASAVYVLDLKGKVLICRNYRGDVDMSEV-EHFMPILMEKEEEGMLSPI-LAHGGVRFM 10 20 30 40 50 60 70 80 90 100 110 pF1KE6 HIRHSGLYLVVTTSENVSPFSLLELLSRLATLLGDYCGSLGEGTISRNVALVYELLDEVL :.:..::::.:...:. .. .: ... ....: : : .: : ...::::::.. CCDS46 WIKHNNLYLVATSKKNACVSLVFSFLYKVVQVFSEYFKELEEESIRDNFVIIYELLDELM 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE6 DYGYVQTTSTEMLRNFIQTEAVVSKPFSLFDLSSVGLFGAETQQSKVAPSSAASRPVLSS :.:: :::....:...: : : . . . : .... : : CCDS46 DFGYPQTTDSKILQEYITQE------------------GHKLETGAPRPPATVTNAV-SW 120 130 140 150 180 190 200 210 220 pF1KE6 RSD--QSQKNEVFLDVVERLSVL------------IASNGSLLKVDVQGEIRLKSFLPSG ::. . .::::::::.: ...: ...::..:. .. : :... :: . CCDS46 RSEGIKYRKNEVFLDVIESVNLLGKYPGVGWLGHTVSANGNVLRSEIVGSIKMRVFLSGM 160 170 180 190 200 210 230 240 250 260 270 280 pF1KE6 SEMRIGLTEEFCVGKSELRGYGPGIRVDEVSFHSSVNLDEFESHRILRLQPPQGELTVMR :.:.::... .. :: . ......:.::. : :..::. : . . ::.::. .: CCDS46 PELRLGLNDKVLFDNTG-RGKSKSVELEDVKFHQCVRLSRFENDRTISFIPPDGEFELMS 220 230 240 250 260 270 290 300 310 320 330 340 pF1KE6 YQLSDDLPSPLPFRLFPSVQWDRGSGRLQVYLKLRCDLLSKSQALNVRLHLPLPRGVVSL :.:. . :. . :: .. .:.. ..: . .. .: : ::..:.:.: . : CCDS46 YRLNTHVK---PLIWIESVIEKHSHSRIEYMIKAKSQFKRRSTANNVEIHIPVPNDADSP 280 290 300 310 320 330 350 360 370 380 390 400 pF1KE6 SQELSSPEQKAELAEGALRWDLPRVQGGSQLSGLFQMDVPGPPGPPSHGLSTSASPLGLG . . . : .. . :.. ::.. .. .:. . ..: .: CCDS46 KFKTTVGSVKWVPENSEIVWSIKSFPGGKEYLMRAHFGLPSVEAEDKEG-----KP---- 340 350 360 370 380 410 420 430 440 450 pF1KE6 PASLSFELPRHTCSGLQVRFLRLAFRPCGNANPHKWVRHLSHSDAYVIRI : :..::.: : ::.:::.:.. . .: : :::..... : .: CCDS46 PISVKFEIPYFTTSGIQVRYLKIIEKSGYQALP--WVRYITQNGDYQLRTQ 390 400 410 420 430 453 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 13:29:57 2016 done: Tue Nov 8 13:29:58 2016 Total Scan time: 2.180 Total Display time: 0.020 Function used was FASTA [36.3.4 Apr, 2011]