FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1299, 255 aa
1>>>pF1KE1299 255 - 255 aa - 255 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5796+/-0.000819; mu= 12.8105+/- 0.049
mean_var=67.0212+/-13.570, 0's: 0 Z-trim(106.5): 47 B-trim: 3 in 1/50
Lambda= 0.156664
statistics sampled from 8990 (9037) to 8990 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.278), width: 16
Scan time: 2.140
The best scores are: opt bits E(32554)
CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 1697 392.3 1.7e-109
CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 1514 351.0 4.7e-97
CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 970 228.0 4.9e-60
CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 958 225.3 3.1e-59
CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 938 220.8 7.2e-58
CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 362 90.6 1.1e-18
>>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa)
initn: 1697 init1: 1697 opt: 1697 Z-score: 2079.5 bits: 392.3 E(32554): 1.7e-109
Smith-Waterman score: 1697; 98.0% identity (100.0% similar) in 255 aa overlap (1-255:1-255)
10 20 30 40 50 60
pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV
:::::::::::::::::::::::::::::::::::::::::::::::.::::::::::::
CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
:::.::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL
:::::::::::::::::::::::::::::::..:::::::::::::::::::::::::::
CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
:::::::::::::::::::::::::::::::::::::::::::::::::.::::::::::
CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
250
pF1KE1 QGLRSVGASRHQGPL
:::::::::::::::
CCDS47 QGLRSVGASRHQGPL
250
>>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa)
initn: 1514 init1: 1514 opt: 1514 Z-score: 1855.9 bits: 351.0 E(32554): 4.7e-97
Smith-Waterman score: 1514; 88.6% identity (96.5% similar) in 255 aa overlap (1-255:1-255)
10 20 30 40 50 60
pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV
:::::::::::::::.::::::::::::::::: :::.:: .:::::.::::::::.:::
CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
::: :::.:. : :::: .::::.:::::::.::.:..:... :::::::::::::::::
CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL
:::::::::::::::::::::::::::::::.:::::::::::::::::::::::::::
CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
:::::::::::::::::.::::::::::::::::::::.::::::::::.::::::::::
CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
250
pF1KE1 QGLRSVGASRHQGPL
::::::::::::: :
CCDS47 QGLRSVGASRHQGLL
250
>>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa)
initn: 925 init1: 888 opt: 970 Z-score: 1191.3 bits: 228.0 E(32554): 4.9e-60
Smith-Waterman score: 970; 57.6% identity (78.8% similar) in 255 aa overlap (1-255:7-260)
10 20 30 40 50
pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDG
:. .:..: ::.:. ..: :. : :::: : . . : . :.:.: :::
CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHV-STYAAFVQTHRPTGEFMFEFDE
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 DEQFYVDLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPE
::.:::::.::::.:. ::.. .:. ::.: :.:. ..::: .:.: : : :::. ::
CCDS47 DEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 VTVFSKSPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKI
:::: : :: ::::::::: .:..::::.:.::: ::. :::::.:. :: ..:.:: :.
CCDS47 VTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 SYLTFLPSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVV
::::.:::...:::.::::::::::::::: . : : : ::::.::::: .:::::.:
CCDS47 HYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV
180 190 200 210 220 230
240 250
pF1KE1 GTVFIIQGLRSVGASRHQGPL
:::.::..::: : :: :
CCDS47 GTVLIIKSLRSGHDPRAQGTL
240 250 260
>>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa)
initn: 965 init1: 943 opt: 958 Z-score: 1176.9 bits: 225.3 E(32554): 3.1e-59
Smith-Waterman score: 958; 57.4% identity (79.3% similar) in 242 aa overlap (1-242:1-242)
10 20 30 40 50 60
pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV
: : .:.:: .: :..:: . :::..: : .:: :: ::::::::: .. : :
CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
::.:.:..:: :::. :. :::::.: ..:. : .:.:...: : . : : :.:::. :
CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL
: : ::::: :::.::::::::.::::: ::..:::::..::: :. :: : :. :: :.
CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
:::...:::.::::::: :::.::: ..: : . ::.::::::..::::..::::.::
CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
190 200 210 220 230 240
250
pF1KE1 QGLRSVGASRHQGPL
.:
CCDS47 MGTYVSSVPR
250
>>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa)
initn: 940 init1: 922 opt: 938 Z-score: 1152.4 bits: 220.8 E(32554): 7.2e-58
Smith-Waterman score: 938; 54.7% identity (77.9% similar) in 258 aa overlap (1-255:1-254)
10 20 30 40 50
pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFY-GP--SGQFTHEFDGDEQ
: .. . .:: . ....:: . : .:: . .:: .: ::.: .:::::
CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV----IIQAEFYLNPDQSGEFMFDFDGDEI
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 FYVDLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTV
:.::. ::::.:: ::..:..:. :::: :.:: : ::.:: :: : : :: :::::
CCDS47 FHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTV
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 FSKSPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYL
...::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. ::
CCDS47 LTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 TFLPSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTV
::::....:::.:::::::.::::::: . :.:. : ::.:::::::.::::::..::.
CCDS47 PFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTI
180 190 200 210 220 230
240 250
pF1KE1 FIIQGLRSVGASRHQGPL
:::.:::. .:....:::
CCDS47 FIIKGLRKSNAAERRGPL
240 250
>>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa)
initn: 346 init1: 141 opt: 362 Z-score: 448.6 bits: 90.6 E(32554): 1.1e-18
Smith-Waterman score: 362; 32.4% identity (64.2% similar) in 204 aa overlap (44-240:55-252)
20 30 40 50 60 70
pF1KE1 LTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYVDLEKKETAWRWPE
:: ... .: :. :. :. .. . : ::
CCDS47 WAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTRVPRLPE
30 40 50 60 70 80
80 90 100 110 120
pF1KE1 FSKFGGFDPQGALRNMAVAKHNLNIMIKRYN-----STAATNEVPEVTVFSKSPVTLGQP
:. .. . :: . :. . ::.. . . .. : . ::. .:. .:.:
CCDS47 FADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKPLEFGKP
90 100 110 120 130 140
130 140 150 160 170 180
pF1KE1 NTLICLVDNIFPPVVNITWLSNGHAV-TEGVSETSFLSKSDH-SFFKISYLTFLPSADEI
:::.:.:.:.:::.....: . :.: .:: . : :.: : :: .:::.: : ..:
CCDS47 NTLVCFVSNLFPPMLTVNW--QHHSVPVEGFGPT-FVSAVDGLSFQAFSYLNFTPEPSDI
150 160 170 180 190
190 200 210 220 230 240
pF1KE1 YDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIQGLRSV
..: : : . .: :. : :.: :.:.:......:..::.:: :.::
CCDS47 FSCIVTHEIDRYTAIAYWVPRNALP-SDLLENVLCGVAFGLGVLGIIVGIVLIIYFRKPC
200 210 220 230 240 250
250
pF1KE1 GASRHQGPL
CCDS47 SGD
260
255 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sun Nov 6 20:36:22 2016 done: Sun Nov 6 20:36:22 2016
Total Scan time: 2.140 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]