FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1551, 254 aa
1>>>pF1KE1551 254 - 254 aa - 254 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.6849+/-0.000856; mu= 11.8649+/- 0.051
mean_var=63.4768+/-12.978, 0's: 0 Z-trim(106.4): 54 B-trim: 262 in 1/52
Lambda= 0.160978
statistics sampled from 8912 (8966) to 8912 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.659), E-opt: 0.2 (0.275), width: 16
Scan time: 1.840
The best scores are: opt bits E(32554)
CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 1489 354.4 4.3e-98
CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 1461 347.9 3.9e-96
CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 967 233.2 1.4e-61
CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 942 227.4 7.4e-60
CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 886 214.4 6.2e-56
CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 324 83.9 1.2e-16
CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 ( 227) 240 64.3 8.1e-11
CCDS4760.1 DMB gene_id:3109|Hs108|chr6 ( 263) 240 64.3 9.3e-11
>>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa)
initn: 1479 init1: 1065 opt: 1489 Z-score: 1874.5 bits: 354.4 E(32554): 4.3e-98
Smith-Waterman score: 1489; 89.0% identity (93.7% similar) in 255 aa overlap (1-254:1-255)
10 20 30 40 50 60
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV
:::::::.::::::::::::::::::::::::: :::::: :::::::::::::::::::
CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV
10 20 30 40 50 60
70 80 90 100 110
pF1KE1 DLGRKETVWCLPVLRQFR-FDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK
:: ::::.: : . .: :::: :: :.:: ::::: .::: :::::::::::::::::
CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL
::::::::: :::::::::::::::::::::.::::::::::::::::::::::::::.:
CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
:::.: :::::::::::.:::::::::::::::::::::::::::::::.::::::::::
CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
240 250
pF1KE1 RGLRSVGASRHQGPL
.::::::::::::::
CCDS47 QGLRSVGASRHQGPL
250
>>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa)
initn: 1460 init1: 1027 opt: 1461 Z-score: 1839.4 bits: 347.9 E(32554): 3.9e-96
Smith-Waterman score: 1461; 86.3% identity (94.5% similar) in 255 aa overlap (1-254:1-255)
10 20 30 40 50 60
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV
:::::::.:::::::.:::::::::::::::::::::.:::.::::::::::::::.:::
CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV
10 20 30 40 50 60
70 80 90 100 110
pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK
:: ::::: ::.. .: :::: :: :.:: ::.:. ....::::::::::::::::::
CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL
:::::::: ::::::::::::::::::::::::::::::::::::::::::::::::.:
CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
:::.: :::::::::::.::::::::::::::::::::.::::::::::.::::::::::
CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
240 250
pF1KE1 RGLRSVGASRHQGPL
.:::::::::::: :
CCDS47 QGLRSVGASRHQGLL
250
>>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa)
initn: 896 init1: 781 opt: 967 Z-score: 1219.2 bits: 233.2 E(32554): 1.4e-61
Smith-Waterman score: 967; 58.0% identity (79.6% similar) in 255 aa overlap (1-254:7-260)
10 20 30 40 50
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDG
:. .:..: ::.:. ..: :. : ::::..:.. . :.. :.:.. :::
CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAA-FVQTHRPTGEFMFEFDE
10 20 30 40 50
60 70 80 90 100 110
pF1KE1 DEQFYVDLGRKETVWCLPVLRQ-FRFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPE
::.::::: .::::: : . : : :. : .:.:::.:..:::.::.::: : :::. ::
CCDS47 DEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPE
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 VTVFSKSPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKI
:::: : :: ::::: ::: .:..::::.:.::: ::. :::::.:. :: ..:.:: :.
CCDS47 VTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKF
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 SYLTLLPSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVV
:::..::::. :::.:::::::.::::::: . : : : ::::.::::: .:::::.:
CCDS47 HYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV
180 190 200 210 220 230
240 250
pF1KE1 GTVFIIRGLRSVGASRHQGPL
:::.::..::: : :: :
CCDS47 GTVLIIKSLRSGHDPRAQGTL
240 250 260
>>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa)
initn: 962 init1: 717 opt: 942 Z-score: 1188.1 bits: 227.4 E(32554): 7.4e-60
Smith-Waterman score: 942; 58.3% identity (79.3% similar) in 242 aa overlap (1-241:1-242)
10 20 30 40 50 60
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV
: : .:.:: .: :..:: . :::..::: .::::: :::.::::: .. : :
CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
10 20 30 40 50 60
70 80 90 100 110
pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK
:: ..:.:: :: . .: ::::: .:..::..: .:. :..::: . : : :.:::. :
CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL
: : :::::::::.::::::::.::::: ::..:::::..::: :. :: : :. :: ..
CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
::::. :::.::::::: :::.::: ..: : . ::.::::::..::::..::::.::
CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
190 200 210 220 230 240
240 250
pF1KE1 RGLRSVGASRHQGPL
:
CCDS47 MGTYVSSVPR
250
>>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa)
initn: 863 init1: 753 opt: 886 Z-score: 1117.7 bits: 214.4 E(32554): 6.2e-56
Smith-Waterman score: 886; 52.9% identity (76.9% similar) in 255 aa overlap (1-254:1-254)
10 20 30 40 50 60
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYV
: .. . .:: . ....:: . : .:: ...: . ::.. .::::: :.:
CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV
10 20 30 40 50
70 80 90 100 110
pF1KE1 DLGRKETVWCLPVLRQF-RFDPQFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSK
:...::::: : . .: :. : ::.:::: : ::. . :::: : :: :::::...
CCDS47 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE1 SPVTLGQPNILICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLL
::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: .:
CCDS47 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE1 PSAEESYDCKVEHWGLDKPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII
::.:. :::.:::::::.::::::: . :.:. : ::.:::::::.::::::..::.:::
CCDS47 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII
180 190 200 210 220 230
240 250
pF1KE1 RGLRSVGASRHQGPL
.:::. .:....:::
CCDS47 KGLRKSNAAERRGPL
240 250
>>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa)
initn: 276 init1: 135 opt: 324 Z-score: 412.1 bits: 83.9 E(32554): 1.2e-16
Smith-Waterman score: 324; 29.7% identity (59.3% similar) in 246 aa overlap (7-239:20-252)
10 20 30 40
pF1KE1 MILNKALMLGALALTTVMSPCGGEDIVADHVASYGVNLYQSYGPSGQ
:. . :. . .: .:. .:. . : :. .::
CCDS47 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDL-QNHTFLHTVYC-QDGSPSVG
10 20 30 40 50
50 60 70 80 90
pF1KE1 YTHEFDGDEQFYVDLGRKETVWCLPVLRQFR----------FDPQFALTNIAVLKHNLNS
.. .: :. :. :.... : :: . .. :: .: : . .:..
CCDS47 LSEAYDEDQLFFFDFSQNTRVPRLPEFADWAQEQGDAPAILFDKEFCEWMIQQIGPKLDG
60 70 80 90 100 110
100 110 120 130 140 150
pF1KE1 LIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPVVNITWLSNGHSV-TEG
: : . : . ::. .:. .:.:: :.:.:.:.:::.....: . ::: .::
CCDS47 KIPVSRG------FPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNW--QHHSVPVEG
120 130 140 150 160 170
160 170 180 190 200 210
pF1KE1 VSETSFLSKSDH-SFFKISYLTLLPSAEESYDCKVEHWGLDK-PLLKHWEPEIPAPMSEL
. : :.: : :: .:::.. : . ..: : : .:. . .: :. : :.:
CCDS47 FGPT-FVSAVDGLSFQAFSYLNFTPEPSDIFSCIVTHE-IDRYTAIAYWVPRNALP-SDL
180 190 200 210 220
220 230 240 250
pF1KE1 TETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL
:.:.:......:..::.:: :.::
CCDS47 LENVLCGVAFGLGVLGIIVGIVLIIYFRKPCSGD
230 240 250 260
>>CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 (227 aa)
initn: 150 init1: 132 opt: 240 Z-score: 307.7 bits: 64.3 E(32554): 8.1e-11
Smith-Waterman score: 240; 26.7% identity (59.0% similar) in 161 aa overlap (54-214:73-226)
30 40 50 60 70 80
pF1KE1 EDIVADHVASYGVNLYQSYGPSGQYTHEFDGDEQFYVDLGRKETVWCLPVLRQFRFDPQF
:. : ..:::. : ..: . .
CCDS56 CYFTNGTERVRGVARYIYNREEYGRFDSDVGEFQAVTELGRSIEDWN--NYKDFLEQERA
50 60 70 80 90 100
90 100 110 120 130 140
pF1KE1 ALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPVVN
:. .. .:: .. .. .: . : ::. . .:.. :.:.: : ...: ..
CCDS56 AVDKVC--RHNYEAELR---TTLQRQVEPTVTISPSRTEALNHHNLLVCSVTDFYPAQIK
110 120 130 140 150
150 160 170 180 190 200
pF1KE1 ITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTLLPSAEESYDCKVEHWGLDKPLLKHW
. :. : . : :: ::.. ..: .: . .: . :. . : :.::: .:..:. .:
CCDS56 VRWFRNDQEETAGVVSTSLIRNGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEW
160 170 180 190 200 210
210 220 230 240 250
pF1KE1 EPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL
.:. : : . :
CCDS56 RPRGPPPAGLLH
220
>>CCDS4760.1 DMB gene_id:3109|Hs108|chr6 (263 aa)
initn: 143 init1: 103 opt: 240 Z-score: 306.6 bits: 64.3 E(32554): 9.3e-11
Smith-Waterman score: 240; 33.3% identity (63.5% similar) in 126 aa overlap (112-236:115-238)
90 100 110 120 130 140
pF1KE1 QFALTNIAVLKHNLNSLIKRSNSTAATNEVPEVTVFSKSPVTLGQPNILICLVDNIFPPV
: : : . .: . .: .: : : ...:
CCDS47 TLMQRLRNGLQNCATHTQPFWGSLTNRTRPPSVQVAKTTPFNTREPVMLACYVWGFYPAE
90 100 110 120 130 140
150 160 170 180 190 200
pF1KE1 VNITWLSNGHSVTEGVS-ETSFLSKSDHSFFKISYLTLLPSAEESYDCKVEHWGLDKPLL
:.::: .::. : : . . ..: .. .:.:.: :: ..: : ::: : .:.:
CCDS47 VTITWRKNGKLVMPHSSAHKTAQPNGDWTYQTLSHLALTPSYGDTYTCVVEHTGAPEPIL
150 160 170 180 190 200
210 220 230 240 250
pF1KE1 KHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIRGLRSVGASRHQGPL
. : : . .::. : .. : :. :..::. . .:..
CCDS47 RDWTPGL-SPMQTL-KVSVSAVTLGLGLIIFSLGVISWRRAGHSSYTPLPGSNYSEGWHI
210 220 230 240 250 260
CCDS47 S
254 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 02:08:46 2016 done: Mon Nov 7 02:08:46 2016
Total Scan time: 1.840 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]