FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE5683, 552 aa 1>>>pF1KE5683 552 - 552 aa - 552 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5392+/-0.00124; mu= 16.8921+/- 0.073 mean_var=61.8822+/-12.749, 0's: 0 Z-trim(100.7): 39 B-trim: 123 in 1/46 Lambda= 0.163039 statistics sampled from 6220 (6230) to 6220 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.536), E-opt: 0.2 (0.191), width: 16 Scan time: 2.300 The best scores are: opt bits E(32554) CCDS6335.1 HAS2 gene_id:3037|Hs108|chr8 ( 552) 3718 883.8 0 CCDS10871.1 HAS3 gene_id:3038|Hs108|chr16 ( 553) 2735 652.6 3.6e-187 CCDS74436.1 HAS1 gene_id:3036|Hs108|chr19 ( 577) 1675 403.2 4.3e-112 CCDS12838.1 HAS1 gene_id:3036|Hs108|chr19 ( 578) 1675 403.2 4.3e-112 CCDS10870.1 HAS3 gene_id:3038|Hs108|chr16 ( 281) 1041 254.0 1.7e-67 >>CCDS6335.1 HAS2 gene_id:3037|Hs108|chr8 (552 aa) initn: 3718 init1: 3718 opt: 3718 Z-score: 4723.3 bits: 883.8 E(32554): 0 Smith-Waterman score: 3718; 100.0% identity (100.0% similar) in 552 aa overlap (1-552:1-552) 10 20 30 40 50 60 pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE5 SLFAFLEHRKMKKSLETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVVMVI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SLFAFLEHRKMKKSLETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVVMVI 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE5 DGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVLSNKS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 DGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVLSNKS 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE5 ICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVGGVGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 ICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVGGVGG 190 200 210 220 230 240 250 260 270 280 290 300 pF1KE5 DVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFVEDWY :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 DVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFVEDWY 250 260 270 280 290 300 310 320 330 340 350 360 pF1KE5 NQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSKSYFR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 NQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSKSYFR 310 320 330 340 350 360 370 380 390 400 410 420 pF1KE5 EWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLVGLIK :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 EWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLVGLIK 370 380 390 400 410 420 430 440 450 460 470 480 pF1KE5 SSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFIGLIP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 SSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFIGLIP 430 440 450 460 470 480 490 500 510 520 530 540 pF1KE5 VSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINKCGRR :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS63 VSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINKCGRR 490 500 510 520 530 540 550 pF1KE5 KKGQQYDMVLDV :::::::::::: CCDS63 KKGQQYDMVLDV 550 >>CCDS10871.1 HAS3 gene_id:3038|Hs108|chr16 (553 aa) initn: 2720 init1: 2048 opt: 2735 Z-score: 3473.7 bits: 652.6 E(32554): 3.6e-187 Smith-Waterman score: 2735; 70.5% identity (90.1% similar) in 546 aa overlap (10-550:9-550) 10 20 30 40 50 60 pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ ::..::.::....: :: :::..:::::.:...:.:::::::.:. ::.:: CCDS10 MPVQLTTALRVVGTSLFALAVLGGILAAYVTGYQFIHTEKHYLSFGLYGAILGLHLLIQ 10 20 30 40 50 70 80 90 100 110 pF1KE5 SLFAFLEHRKMKKS---LETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVV :::::::::.:... :. : .:::::::::::::::::::.:..:...: .::: CCDS10 SLFAFLEHRRMRRAGQALKLPSPRRGSVALCIAAYQEDPDYLRKCLRSAQRISFPDLKVV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 MVIDGNSEDDLYMMDIFSEVMG-RDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVL ::.::: ..: ::.::: ::.: .... ..:..:::: : :::. : .:. ..: ..: CCDS10 MVVDGNRQEDAYMLDIFHEVLGGTEQAGFFVWRSNFHEAGEGETEASLQEGMDRVRDVVR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 SNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVG .. :::::::::::::::::.::: ::::.:::::::.:::: ..::..::::::.:: CCDS10 ASTFSCIMQKWGGKREVMYTAFKALGDSVDYIQVCDSDTVLDPACTIEMLRVLEEDPQVG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 GVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFV :::::::::::::::::::::::::::::.::::::::::::::::::::::::::..:. CCDS10 GVGGDVQILNKYDSWISFLSSVRYWMAFNVERACQSYFGCVQCISGPLGMYRNSLLQQFL 240 250 260 270 280 290 300 310 320 330 340 350 pF1KE5 EDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSK ::::.:.:.:..:::::::::::::::::: :::::::::::::: .::::::::::::: CCDS10 EDWYHQKFLGSKCSFGDDRHLTNRVLSLGYRTKYTARSKCLTETPTKYLRWLNQQTRWSK 300 310 320 330 340 350 360 370 380 390 400 410 pF1KE5 SYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLV :::::::::..::::::::::::...:::::::::::::::::::.:::::::::::::: CCDS10 SYFREWLYNSLWFHKHHLWMTYESVVTGFFPFFLIATVIQLFYRGRIWNILLFLLTVQLV 360 370 380 390 400 410 420 430 440 450 460 470 pF1KE5 GLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFI :.::...: :::: :.::::::.::::::::::.::::::::.::::::::::::::: CCDS10 GIIKATYACFLRGNAEMIFMSLYSLLYMSSLLPAKIFAIATINKSGWGTSGRKTIVVNFI 420 430 440 450 460 470 480 490 500 510 520 530 pF1KE5 GLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINK ::::::.: ..::::. .: : .. :::.. . :. :..::.:::: :: ::...: . CCDS10 GLIPVSIWVAVLLGGLAYTAYCQDL--FSETELAFLVSGAILYGCYWVALLMLYLAIIAR 480 490 500 510 520 530 540 550 pF1KE5 -CGRRKKGQQYDMVLDV :: :: .::.... CCDS10 RCG--KKPEQYSLAFAEV 540 550 >>CCDS74436.1 HAS1 gene_id:3036|Hs108|chr19 (577 aa) initn: 2062 init1: 1607 opt: 1675 Z-score: 2125.9 bits: 403.2 E(32554): 4.3e-112 Smith-Waterman score: 2085; 54.3% identity (78.7% similar) in 554 aa overlap (11-543:20-571) 10 20 30 40 pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGI-TAAYIVGYQFIQTDNY-YFSFGLY : . : :.. :.::. : :: .: . .: : ..:::: CCDS74 MRQDAPKPTPAACRCSGLARRVLTIAFAL-LILGLMTWAYAAGVP-LASDRYGLLAFGLY 10 20 30 40 50 50 60 70 80 90 100 pF1KE5 GAFLASHLIIQSLFAFLEHRKMKKSLETPIK--LNKTVALCIAAYQEDPDYLRKCLQSVK ::::..::. :::::.::::.. . . :. ..::: :.:::::: :::.:: :.. CCDS74 GAFLSAHLVAQSLFAYLEHRRVAAAARGPLDAATARSVALTISAYQEDPAYLRQCLASAR 60 70 80 90 100 110 110 120 130 140 150 pF1KE5 RLTYPG--IKVVMVIDGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEK---------G : :: ..:.::.::: .::::.:.: ::.. . :::.: .:.:. : CCDS74 ALLYPRARLRVLMVVDGNRAEDLYMVDMFREVFADEDPATYVWDGNYHQPWEPAAAGAVG 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE5 PGETDESHKESSQH--VTQLVLSNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSD : : . :. . : :: . . .:. :.::::::::::::.::: ::::::::::: CCDS74 AGAYREVEAEDPGRLAVEALVRTRRCVCVAQRWGGKREVMYTAFKALGDSVDYVQVCDSD 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE5 TMLDPASSVEMVKVLEEDPMVGGVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYF : ::: . .:.:.::.::: ::.:::::.::: :::.:::::.:::.:::.:::::::: CCDS74 TRLDPMALLELVRVLDEDPRVGAVGGDVRILNPLDSWVSFLSSLRYWVAFNVERACQSYF 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE5 GCVQCISGPLGMYRNSLLHEFVEDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARS ::.:::::::.:::.::..:.: ::::.:.:..:.::::::::::.::.:::::::.:: CCDS74 HCVSCISGPLGLYRNNLLQQFLEAWYNQKFLGTHCTFGDDRHLTNRMLSMGYATKYTSRS 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE5 KCLTETPIEYLRWLNQQTRWSKSYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATV .: .::: .::::.:::::::::::::::::.:.:.:: ::::::...:.::::. ::: CCDS74 RCYSETPSSFLRWLSQQTRWSKSYFREWLYNALWWHRHHAWMTYEAVVSGLFPFFVAATV 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE5 IQLFYRGKIWNILLFLLTVQLVGLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFA ..::: :. : .: :: :: :.: :..::. ::: . ::..:::. ::: .:::::..: CCDS74 LRLFYAGRPWALLWVLLCVQGVALAKAAFAAWLRGCLRMVLLSLYAPLYMCGLLPAKFLA 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE5 IATINKAGWGTSGRKTIVVNFIGLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTV--- ..:.:..:::::::. ...:.. :.:...: .::::.. .. .:.. .: .... CCDS74 LVTMNQSGWGTSGRRKLAANYVPLLPLALWALLLLGGLVRSVAHEARADWSGPSRAAEAY 480 490 500 510 520 530 520 530 540 550 pF1KE5 -LIVGTLLYACYWVMLLTLYVVLINKCGRRKKGQQYDMVLDV : .:. :. ::: .:::: : . . ::. : CCDS74 HLAAGAGAYVGYWVAMLTLYWVGVRRLCRRRTGGYRVQV 540 550 560 570 >>CCDS12838.1 HAS1 gene_id:3036|Hs108|chr19 (578 aa) initn: 2062 init1: 1607 opt: 1675 Z-score: 2125.9 bits: 403.2 E(32554): 4.3e-112 Smith-Waterman score: 2085; 54.3% identity (78.7% similar) in 554 aa overlap (11-543:21-572) 10 20 30 40 pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGI-TAAYIVGYQFIQTDNY-YFSFGL : . : :.. :.::. : :: .: . .: : ..::: CCDS12 MRQQDAPKPTPAACRCSGLARRVLTIAFAL-LILGLMTWAYAAGVP-LASDRYGLLAFGL 10 20 30 40 50 50 60 70 80 90 100 pF1KE5 YGAFLASHLIIQSLFAFLEHRKMKKSLETPIK--LNKTVALCIAAYQEDPDYLRKCLQSV :::::..::. :::::.::::.. . . :. ..::: :.:::::: :::.:: :. CCDS12 YGAFLSAHLVAQSLFAYLEHRRVAAAARGPLDAATARSVALTISAYQEDPAYLRQCLASA 60 70 80 90 100 110 110 120 130 140 150 pF1KE5 KRLTYPG--IKVVMVIDGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEK--------- . : :: ..:.::.::: .::::.:.: ::.. . :::.: .:.:. CCDS12 RALLYPRARLRVLMVVDGNRAEDLYMVDMFREVFADEDPATYVWDGNYHQPWEPAAAGAV 120 130 140 150 160 170 160 170 180 190 200 210 pF1KE5 GPGETDESHKESSQH--VTQLVLSNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDS : : : . :. . : :: . . .:. :.::::::::::::.::: :::::::::: CCDS12 GAGAYREVEAEDPGRLAVEALVRTRRCVCVAQRWGGKREVMYTAFKALGDSVDYVQVCDS 180 190 200 210 220 230 220 230 240 250 260 270 pF1KE5 DTMLDPASSVEMVKVLEEDPMVGGVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSY :: ::: . .:.:.::.::: ::.:::::.::: :::.:::::.:::.:::.::::::: CCDS12 DTRLDPMALLELVRVLDEDPRVGAVGGDVRILNPLDSWVSFLSSLRYWVAFNVERACQSY 240 250 260 270 280 290 280 290 300 310 320 330 pF1KE5 FGCVQCISGPLGMYRNSLLHEFVEDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTAR : ::.:::::::.:::.::..:.: ::::.:.:..:.::::::::::.::.:::::::.: CCDS12 FHCVSCISGPLGLYRNNLLQQFLEAWYNQKFLGTHCTFGDDRHLTNRMLSMGYATKYTSR 300 310 320 330 340 350 340 350 360 370 380 390 pF1KE5 SKCLTETPIEYLRWLNQQTRWSKSYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIAT :.: .::: .::::.:::::::::::::::::.:.:.:: ::::::...:.::::. :: CCDS12 SRCYSETPSSFLRWLSQQTRWSKSYFREWLYNALWWHRHHAWMTYEAVVSGLFPFFVAAT 360 370 380 390 400 410 400 410 420 430 440 450 pF1KE5 VIQLFYRGKIWNILLFLLTVQLVGLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMF :..::: :. : .: :: :: :.: :..::. ::: . ::..:::. ::: .:::::.. CCDS12 VLRLFYAGRPWALLWVLLCVQGVALAKAAFAAWLRGCLRMVLLSLYAPLYMCGLLPAKFL 420 430 440 450 460 470 460 470 480 490 500 510 pF1KE5 AIATINKAGWGTSGRKTIVVNFIGLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTV-- :..:.:..:::::::. ...:.. :.:...: .::::.. .. .:.. .: .... CCDS12 ALVTMNQSGWGTSGRRKLAANYVPLLPLALWALLLLGGLVRSVAHEARADWSGPSRAAEA 480 490 500 510 520 530 520 530 540 550 pF1KE5 --LIVGTLLYACYWVMLLTLYVVLINKCGRRKKGQQYDMVLDV : .:. :. ::: .:::: : . . ::. : CCDS12 YHLAAGAGAYVGYWVAMLTLYWVGVRRLCRRRTGGYRVQV 540 550 560 570 >>CCDS10870.1 HAS3 gene_id:3038|Hs108|chr16 (281 aa) initn: 764 init1: 483 opt: 1041 Z-score: 1325.0 bits: 254.0 E(32554): 1.7e-67 Smith-Waterman score: 1041; 61.8% identity (87.0% similar) in 238 aa overlap (10-243:9-246) 10 20 30 40 50 60 pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ ::..::.::....: :: :::..:::::.:...:.:::::::.:. ::.:: CCDS10 MPVQLTTALRVVGTSLFALAVLGGILAAYVTGYQFIHTEKHYLSFGLYGAILGLHLLIQ 10 20 30 40 50 70 80 90 100 110 pF1KE5 SLFAFLEHRKMKKS---LETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVV :::::::::.:... :. : .:::::::::::::::::::.:..:...: .::: CCDS10 SLFAFLEHRRMRRAGQALKLPSPRRGSVALCIAAYQEDPDYLRKCLRSAQRISFPDLKVV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE5 MVIDGNSEDDLYMMDIFSEVMG-RDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVL ::.::: ..: ::.::: ::.: .... ..:..:::: : :::. : .:. ..: ..: CCDS10 MVVDGNRQEDAYMLDIFHEVLGGTEQAGFFVWRSNFHEAGEGETEASLQEGMDRVRDVVR 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE5 SNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVG .. :::::::::::::::::.::: ::::.:::::::.:::: ..::..::::::.:: CCDS10 ASTFSCIMQKWGGKREVMYTAFKALGDSVDYIQVCDSDTVLDPACTIEMLRVLEEDPQVG 180 190 200 210 220 230 240 250 260 270 280 290 pF1KE5 GVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFV ::::::: CCDS10 GVGGDVQPPGKGMAVEDDQVQAAQVRATEAWSVHQRHVSREQ 240 250 260 270 280 552 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Tue Nov 8 03:29:18 2016 done: Tue Nov 8 03:29:18 2016 Total Scan time: 2.300 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]