FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE5683, 552 aa
1>>>pF1KE5683 552 - 552 aa - 552 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5392+/-0.00124; mu= 16.8921+/- 0.073
mean_var=61.8822+/-12.749, 0's: 0 Z-trim(100.7): 39 B-trim: 123 in 1/46
Lambda= 0.163039
statistics sampled from 6220 (6230) to 6220 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.536), E-opt: 0.2 (0.191), width: 16
Scan time: 2.300
The best scores are: opt bits E(32554)
CCDS6335.1 HAS2 gene_id:3037|Hs108|chr8 ( 552) 3718 883.8 0
CCDS10871.1 HAS3 gene_id:3038|Hs108|chr16 ( 553) 2735 652.6 3.6e-187
CCDS74436.1 HAS1 gene_id:3036|Hs108|chr19 ( 577) 1675 403.2 4.3e-112
CCDS12838.1 HAS1 gene_id:3036|Hs108|chr19 ( 578) 1675 403.2 4.3e-112
CCDS10870.1 HAS3 gene_id:3038|Hs108|chr16 ( 281) 1041 254.0 1.7e-67
>>CCDS6335.1 HAS2 gene_id:3037|Hs108|chr8 (552 aa)
initn: 3718 init1: 3718 opt: 3718 Z-score: 4723.3 bits: 883.8 E(32554): 0
Smith-Waterman score: 3718; 100.0% identity (100.0% similar) in 552 aa overlap (1-552:1-552)
10 20 30 40 50 60
pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE5 SLFAFLEHRKMKKSLETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVVMVI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 SLFAFLEHRKMKKSLETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVVMVI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE5 DGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVLSNKS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 DGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVLSNKS
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE5 ICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVGGVGG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 ICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVGGVGG
190 200 210 220 230 240
250 260 270 280 290 300
pF1KE5 DVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFVEDWY
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 DVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFVEDWY
250 260 270 280 290 300
310 320 330 340 350 360
pF1KE5 NQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSKSYFR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 NQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSKSYFR
310 320 330 340 350 360
370 380 390 400 410 420
pF1KE5 EWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLVGLIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 EWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLVGLIK
370 380 390 400 410 420
430 440 450 460 470 480
pF1KE5 SSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFIGLIP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 SSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFIGLIP
430 440 450 460 470 480
490 500 510 520 530 540
pF1KE5 VSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINKCGRR
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS63 VSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINKCGRR
490 500 510 520 530 540
550
pF1KE5 KKGQQYDMVLDV
::::::::::::
CCDS63 KKGQQYDMVLDV
550
>>CCDS10871.1 HAS3 gene_id:3038|Hs108|chr16 (553 aa)
initn: 2720 init1: 2048 opt: 2735 Z-score: 3473.7 bits: 652.6 E(32554): 3.6e-187
Smith-Waterman score: 2735; 70.5% identity (90.1% similar) in 546 aa overlap (10-550:9-550)
10 20 30 40 50 60
pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ
::..::.::....: :: :::..:::::.:...:.:::::::.:. ::.::
CCDS10 MPVQLTTALRVVGTSLFALAVLGGILAAYVTGYQFIHTEKHYLSFGLYGAILGLHLLIQ
10 20 30 40 50
70 80 90 100 110
pF1KE5 SLFAFLEHRKMKKS---LETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVV
:::::::::.:... :. : .:::::::::::::::::::.:..:...: .:::
CCDS10 SLFAFLEHRRMRRAGQALKLPSPRRGSVALCIAAYQEDPDYLRKCLRSAQRISFPDLKVV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 MVIDGNSEDDLYMMDIFSEVMG-RDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVL
::.::: ..: ::.::: ::.: .... ..:..:::: : :::. : .:. ..: ..:
CCDS10 MVVDGNRQEDAYMLDIFHEVLGGTEQAGFFVWRSNFHEAGEGETEASLQEGMDRVRDVVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 SNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVG
.. :::::::::::::::::.::: ::::.:::::::.:::: ..::..::::::.::
CCDS10 ASTFSCIMQKWGGKREVMYTAFKALGDSVDYIQVCDSDTVLDPACTIEMLRVLEEDPQVG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE5 GVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFV
:::::::::::::::::::::::::::::.::::::::::::::::::::::::::..:.
CCDS10 GVGGDVQILNKYDSWISFLSSVRYWMAFNVERACQSYFGCVQCISGPLGMYRNSLLQQFL
240 250 260 270 280 290
300 310 320 330 340 350
pF1KE5 EDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARSKCLTETPIEYLRWLNQQTRWSK
::::.:.:.:..:::::::::::::::::: :::::::::::::: .:::::::::::::
CCDS10 EDWYHQKFLGSKCSFGDDRHLTNRVLSLGYRTKYTARSKCLTETPTKYLRWLNQQTRWSK
300 310 320 330 340 350
360 370 380 390 400 410
pF1KE5 SYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATVIQLFYRGKIWNILLFLLTVQLV
:::::::::..::::::::::::...:::::::::::::::::::.::::::::::::::
CCDS10 SYFREWLYNSLWFHKHHLWMTYESVVTGFFPFFLIATVIQLFYRGRIWNILLFLLTVQLV
360 370 380 390 400 410
420 430 440 450 460 470
pF1KE5 GLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFAIATINKAGWGTSGRKTIVVNFI
:.::...: :::: :.::::::.::::::::::.::::::::.:::::::::::::::
CCDS10 GIIKATYACFLRGNAEMIFMSLYSLLYMSSLLPAKIFAIATINKSGWGTSGRKTIVVNFI
420 430 440 450 460 470
480 490 500 510 520 530
pF1KE5 GLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTVLIVGTLLYACYWVMLLTLYVVLINK
::::::.: ..::::. .: : .. :::.. . :. :..::.:::: :: ::...: .
CCDS10 GLIPVSIWVAVLLGGLAYTAYCQDL--FSETELAFLVSGAILYGCYWVALLMLYLAIIAR
480 490 500 510 520 530
540 550
pF1KE5 -CGRRKKGQQYDMVLDV
:: :: .::....
CCDS10 RCG--KKPEQYSLAFAEV
540 550
>>CCDS74436.1 HAS1 gene_id:3036|Hs108|chr19 (577 aa)
initn: 2062 init1: 1607 opt: 1675 Z-score: 2125.9 bits: 403.2 E(32554): 4.3e-112
Smith-Waterman score: 2085; 54.3% identity (78.7% similar) in 554 aa overlap (11-543:20-571)
10 20 30 40
pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGI-TAAYIVGYQFIQTDNY-YFSFGLY
: . : :.. :.::. : :: .: . .: : ..::::
CCDS74 MRQDAPKPTPAACRCSGLARRVLTIAFAL-LILGLMTWAYAAGVP-LASDRYGLLAFGLY
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 GAFLASHLIIQSLFAFLEHRKMKKSLETPIK--LNKTVALCIAAYQEDPDYLRKCLQSVK
::::..::. :::::.::::.. . . :. ..::: :.:::::: :::.:: :..
CCDS74 GAFLSAHLVAQSLFAYLEHRRVAAAARGPLDAATARSVALTISAYQEDPAYLRQCLASAR
60 70 80 90 100 110
110 120 130 140 150
pF1KE5 RLTYPG--IKVVMVIDGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEK---------G
: :: ..:.::.::: .::::.:.: ::.. . :::.: .:.:. :
CCDS74 ALLYPRARLRVLMVVDGNRAEDLYMVDMFREVFADEDPATYVWDGNYHQPWEPAAAGAVG
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE5 PGETDESHKESSQH--VTQLVLSNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSD
: : . :. . : :: . . .:. :.::::::::::::.::: :::::::::::
CCDS74 AGAYREVEAEDPGRLAVEALVRTRRCVCVAQRWGGKREVMYTAFKALGDSVDYVQVCDSD
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE5 TMLDPASSVEMVKVLEEDPMVGGVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYF
: ::: . .:.:.::.::: ::.:::::.::: :::.:::::.:::.:::.::::::::
CCDS74 TRLDPMALLELVRVLDEDPRVGAVGGDVRILNPLDSWVSFLSSLRYWVAFNVERACQSYF
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE5 GCVQCISGPLGMYRNSLLHEFVEDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTARS
::.:::::::.:::.::..:.: ::::.:.:..:.::::::::::.::.:::::::.::
CCDS74 HCVSCISGPLGLYRNNLLQQFLEAWYNQKFLGTHCTFGDDRHLTNRMLSMGYATKYTSRS
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE5 KCLTETPIEYLRWLNQQTRWSKSYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIATV
.: .::: .::::.:::::::::::::::::.:.:.:: ::::::...:.::::. :::
CCDS74 RCYSETPSSFLRWLSQQTRWSKSYFREWLYNALWWHRHHAWMTYEAVVSGLFPFFVAATV
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE5 IQLFYRGKIWNILLFLLTVQLVGLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMFA
..::: :. : .: :: :: :.: :..::. ::: . ::..:::. ::: .:::::..:
CCDS74 LRLFYAGRPWALLWVLLCVQGVALAKAAFAAWLRGCLRMVLLSLYAPLYMCGLLPAKFLA
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE5 IATINKAGWGTSGRKTIVVNFIGLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTV---
..:.:..:::::::. ...:.. :.:...: .::::.. .. .:.. .: ....
CCDS74 LVTMNQSGWGTSGRRKLAANYVPLLPLALWALLLLGGLVRSVAHEARADWSGPSRAAEAY
480 490 500 510 520 530
520 530 540 550
pF1KE5 -LIVGTLLYACYWVMLLTLYVVLINKCGRRKKGQQYDMVLDV
: .:. :. ::: .:::: : . . ::. :
CCDS74 HLAAGAGAYVGYWVAMLTLYWVGVRRLCRRRTGGYRVQV
540 550 560 570
>>CCDS12838.1 HAS1 gene_id:3036|Hs108|chr19 (578 aa)
initn: 2062 init1: 1607 opt: 1675 Z-score: 2125.9 bits: 403.2 E(32554): 4.3e-112
Smith-Waterman score: 2085; 54.3% identity (78.7% similar) in 554 aa overlap (11-543:21-572)
10 20 30 40
pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGI-TAAYIVGYQFIQTDNY-YFSFGL
: . : :.. :.::. : :: .: . .: : ..:::
CCDS12 MRQQDAPKPTPAACRCSGLARRVLTIAFAL-LILGLMTWAYAAGVP-LASDRYGLLAFGL
10 20 30 40 50
50 60 70 80 90 100
pF1KE5 YGAFLASHLIIQSLFAFLEHRKMKKSLETPIK--LNKTVALCIAAYQEDPDYLRKCLQSV
:::::..::. :::::.::::.. . . :. ..::: :.:::::: :::.:: :.
CCDS12 YGAFLSAHLVAQSLFAYLEHRRVAAAARGPLDAATARSVALTISAYQEDPAYLRQCLASA
60 70 80 90 100 110
110 120 130 140 150
pF1KE5 KRLTYPG--IKVVMVIDGNSEDDLYMMDIFSEVMGRDKSATYIWKNNFHEK---------
. : :: ..:.::.::: .::::.:.: ::.. . :::.: .:.:.
CCDS12 RALLYPRARLRVLMVVDGNRAEDLYMVDMFREVFADEDPATYVWDGNYHQPWEPAAAGAV
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE5 GPGETDESHKESSQH--VTQLVLSNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDS
: : : . :. . : :: . . .:. :.::::::::::::.::: ::::::::::
CCDS12 GAGAYREVEAEDPGRLAVEALVRTRRCVCVAQRWGGKREVMYTAFKALGDSVDYVQVCDS
180 190 200 210 220 230
220 230 240 250 260 270
pF1KE5 DTMLDPASSVEMVKVLEEDPMVGGVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSY
:: ::: . .:.:.::.::: ::.:::::.::: :::.:::::.:::.:::.:::::::
CCDS12 DTRLDPMALLELVRVLDEDPRVGAVGGDVRILNPLDSWVSFLSSLRYWVAFNVERACQSY
240 250 260 270 280 290
280 290 300 310 320 330
pF1KE5 FGCVQCISGPLGMYRNSLLHEFVEDWYNQEFMGNQCSFGDDRHLTNRVLSLGYATKYTAR
: ::.:::::::.:::.::..:.: ::::.:.:..:.::::::::::.::.:::::::.:
CCDS12 FHCVSCISGPLGLYRNNLLQQFLEAWYNQKFLGTHCTFGDDRHLTNRMLSMGYATKYTSR
300 310 320 330 340 350
340 350 360 370 380 390
pF1KE5 SKCLTETPIEYLRWLNQQTRWSKSYFREWLYNAMWFHKHHLWMTYEAIITGFFPFFLIAT
:.: .::: .::::.:::::::::::::::::.:.:.:: ::::::...:.::::. ::
CCDS12 SRCYSETPSSFLRWLSQQTRWSKSYFREWLYNALWWHRHHAWMTYEAVVSGLFPFFVAAT
360 370 380 390 400 410
400 410 420 430 440 450
pF1KE5 VIQLFYRGKIWNILLFLLTVQLVGLIKSSFASCLRGNIVMVFMSLYSVLYMSSLLPAKMF
:..::: :. : .: :: :: :.: :..::. ::: . ::..:::. ::: .:::::..
CCDS12 VLRLFYAGRPWALLWVLLCVQGVALAKAAFAAWLRGCLRMVLLSLYAPLYMCGLLPAKFL
420 430 440 450 460 470
460 470 480 490 500 510
pF1KE5 AIATINKAGWGTSGRKTIVVNFIGLIPVSVWFTILLGGVIFTIYKESKRPFSESKQTV--
:..:.:..:::::::. ...:.. :.:...: .::::.. .. .:.. .: ....
CCDS12 ALVTMNQSGWGTSGRRKLAANYVPLLPLALWALLLLGGLVRSVAHEARADWSGPSRAAEA
480 490 500 510 520 530
520 530 540 550
pF1KE5 --LIVGTLLYACYWVMLLTLYVVLINKCGRRKKGQQYDMVLDV
: .:. :. ::: .:::: : . . ::. :
CCDS12 YHLAAGAGAYVGYWVAMLTLYWVGVRRLCRRRTGGYRVQV
540 550 560 570
>>CCDS10870.1 HAS3 gene_id:3038|Hs108|chr16 (281 aa)
initn: 764 init1: 483 opt: 1041 Z-score: 1325.0 bits: 254.0 E(32554): 1.7e-67
Smith-Waterman score: 1041; 61.8% identity (87.0% similar) in 238 aa overlap (10-243:9-246)
10 20 30 40 50 60
pF1KE5 MHCERFLCILRIIGTTLFGVSLLLGITAAYIVGYQFIQTDNYYFSFGLYGAFLASHLIIQ
::..::.::....: :: :::..:::::.:...:.:::::::.:. ::.::
CCDS10 MPVQLTTALRVVGTSLFALAVLGGILAAYVTGYQFIHTEKHYLSFGLYGAILGLHLLIQ
10 20 30 40 50
70 80 90 100 110
pF1KE5 SLFAFLEHRKMKKS---LETPIKLNKTVALCIAAYQEDPDYLRKCLQSVKRLTYPGIKVV
:::::::::.:... :. : .:::::::::::::::::::.:..:...: .:::
CCDS10 SLFAFLEHRRMRRAGQALKLPSPRRGSVALCIAAYQEDPDYLRKCLRSAQRISFPDLKVV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE5 MVIDGNSEDDLYMMDIFSEVMG-RDKSATYIWKNNFHEKGPGETDESHKESSQHVTQLVL
::.::: ..: ::.::: ::.: .... ..:..:::: : :::. : .:. ..: ..:
CCDS10 MVVDGNRQEDAYMLDIFHEVLGGTEQAGFFVWRSNFHEAGEGETEASLQEGMDRVRDVVR
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE5 SNKSICIMQKWGGKREVMYTAFRALGRSVDYVQVCDSDTMLDPASSVEMVKVLEEDPMVG
.. :::::::::::::::::.::: ::::.:::::::.:::: ..::..::::::.::
CCDS10 ASTFSCIMQKWGGKREVMYTAFKALGDSVDYIQVCDSDTVLDPACTIEMLRVLEEDPQVG
180 190 200 210 220 230
240 250 260 270 280 290
pF1KE5 GVGGDVQILNKYDSWISFLSSVRYWMAFNIERACQSYFGCVQCISGPLGMYRNSLLHEFV
:::::::
CCDS10 GVGGDVQPPGKGMAVEDDQVQAAQVRATEAWSVHQRHVSREQ
240 250 260 270 280
552 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 03:29:18 2016 done: Tue Nov 8 03:29:18 2016
Total Scan time: 2.300 Total Display time: 0.060
Function used was FASTA [36.3.4 Apr, 2011]