FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE6210, 250 aa
1>>>pF1KE6210 250 - 250 aa - 250 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.7365+/-0.000759; mu= 12.1016+/- 0.046
mean_var=74.1292+/-14.841, 0's: 0 Z-trim(109.4): 49 B-trim: 0 in 0/54
Lambda= 0.148963
statistics sampled from 10827 (10876) to 10827 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.715), E-opt: 0.2 (0.334), width: 16
Scan time: 1.640
The best scores are: opt bits E(32554)
CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 1695 373.2 9.2e-104
CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 955 214.2 7e-56
CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 943 211.6 4.1e-55
CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 940 211.0 6.6e-55
CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 932 209.2 2.1e-54
CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 363 87.0 1.4e-17
CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 ( 258) 273 67.6 9.3e-12
CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 ( 264) 262 65.3 4.9e-11
CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 ( 227) 258 64.4 7.8e-11
>>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa)
initn: 1695 init1: 1695 opt: 1695 Z-score: 1976.4 bits: 373.2 E(32554): 9.2e-104
Smith-Waterman score: 1695; 100.0% identity (100.0% similar) in 250 aa overlap (1-250:1-250)
10 20 30 40 50 60
pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
190 200 210 220 230 240
250
pF1KE6 MGTYVSSVPR
::::::::::
CCDS47 MGTYVSSVPR
250
>>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa)
initn: 962 init1: 940 opt: 955 Z-score: 1116.8 bits: 214.2 E(32554): 7e-56
Smith-Waterman score: 955; 56.6% identity (79.3% similar) in 242 aa overlap (1-242:1-242)
10 20 30 40 50 60
pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
: : .:.:: .: :..:: . :::..: : .:: :: :::.::::: .. : :
CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
::...:..:: :::. :. :::::.: ..:. : .:.:...: : . : : :.:::. :
CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
: : ::::: :::.::::::::.::::: :::.:::::..::: :. :: : :. :: :.
CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
:::...:::.::::::: :::.::: ..: : . ::.::::::..::.:..::::.::
CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
250
pF1KE6 MGTYVSSVPR
.:
CCDS47 QGLRSVGASRHQGPL
250
>>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa)
initn: 1000 init1: 887 opt: 943 Z-score: 1102.9 bits: 211.6 E(32554): 4.1e-55
Smith-Waterman score: 943; 54.7% identity (78.9% similar) in 247 aa overlap (1-247:1-246)
10 20 30 40 50 60
pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
::. . :::: . .:.: ::. : : .:. :: . ::.: .:: ...: :
CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV-IIQAEFYLNPDQSGEFMFDFDGDEIFHV
10 20 30 40 50
70 80 90 100 110 120
pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
:. :.:.:::: ::: :: :. ::.::.::. ::.:.:...::: . ::::.:::: .
CCDS47 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN
60 70 80 90 100 110
130 140 150 160 170 180
pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
: ::: .::.:::..:.. :::.:.::::::. :: ::..: : . ::::::::::::.
CCDS47 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
::.::::::.::::::: :::.:::...: : :.. :..::::::..::::...::..::
CCDS47 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII
180 190 200 210 220 230
250
pF1KE6 MGTYVSSVPR
: :.
CCDS47 KGLRKSNAAERRGPL
240 250
>>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa)
initn: 935 init1: 879 opt: 940 Z-score: 1099.2 bits: 211.0 E(32554): 6.6e-55
Smith-Waterman score: 940; 56.5% identity (79.0% similar) in 248 aa overlap (3-250:10-255)
10 20 30 40 50
pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFD
.:: ..: .: ::: . ::: ::::...:. :: :.. .:.: :::
CCDS47 MRPEDRMFHIRA-VILRALSLAFLLSLRGAGAIKADHVSTYA-AFVQTHRPTGEFMFEFD
10 20 30 40 50
60 70 80 90 100 110
pF1KE6 EEQLFSVDLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPP
:...: ::: :.:.::.: :::. :. :::::.:: .. .:. :..:::...: : ::
CCDS47 EDEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPP
60 70 80 90 100 110
120 130 140 150 160 170
pF1KE6 RVTVLPKSRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRK
.:::.:: ::::::: ::: .:..::::.:.::: ::. ::::::.. : . :. :.:
CCDS47 EVTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHK
120 130 140 150 160 170
180 190 200 210 220 230
pF1KE6 FHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFL
:::: ::::::: :::.::::::: :::.::: : :: :.. ::..:::::..::::..
CCDS47 FHYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGII
180 190 200 210 220 230
240 250
pF1KE6 VGTVLIIMGTYVSSVPR
::::::: . . ::
CCDS47 VGTVLIIKSLRSGHDPRAQGTL
240 250 260
>>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa)
initn: 940 init1: 917 opt: 932 Z-score: 1090.1 bits: 209.2 E(32554): 2.1e-54
Smith-Waterman score: 932; 55.8% identity (78.9% similar) in 242 aa overlap (1-242:1-242)
10 20 30 40 50 60
pF1KE6 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
: : .:.:: .: ...:: . :::..::: ::::.: :::.::::: .. : :
CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE6 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
::. .:.::.:: :. : ::::..: ..:. : :......:: . : : :.:::. :
CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE6 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
: ::::: :::.::::::::.::::: ::..:::::..::: :. :: : :. :: :.
CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE6 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
:::...:::.::::::: :::.::: ..: : . :::::::::..::.:..::::.::
CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
250
pF1KE6 MGTYVSSVPR
.:
CCDS47 QGLRSVGASRHQGLL
250
>>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa)
initn: 262 init1: 102 opt: 363 Z-score: 429.0 bits: 87.0 E(32554): 1.4e-17
Smith-Waterman score: 363; 32.2% identity (63.0% similar) in 211 aa overlap (38-240:49-252)
10 20 30 40 50 60
pF1KE6 VLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSVDLKKSEA
. :. . : ... .::.::: :....
CCDS47 WLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTR
20 30 40 50 60 70
70 80 90 100 110 120
pF1KE6 VWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVP-----PRVTVLPKSR
: :::::.:.:. :: .: : . .... . . ..: : . :. .
CCDS47 VPRLPEFADWAQ--EQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKP
80 90 100 110 120 130
130 140 150 160 170 180
pF1KE6 VELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHL-FRKFHYLPFVP
.:.:.:: :.:.:.:.:::.....: ... : :: . : : : : : :. : :: :.:
CCDS47 LEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPT-FVSAVDGLSFQAFSYLNFTP
140 150 160 170 180 190
190 200 210 220 230
pF1KE6 SAEDVYDCQVEHWGLDAPLLRHWELQVP--IPPPDAMETLVCALGLAIGLVGFLVGTVLI
:...: : : . .: :: : : .:...:......:..:..:: :::
CCDS47 EPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLCGVAFGLGVLGIIVGIVLI
200 210 220 230 240 250
240 250
pF1KE6 IMGTYVSSVPR
:
CCDS47 IYFRKPCSGD
260
>>CCDS4765.1 DPB1 gene_id:3115|Hs108|chr6 (258 aa)
initn: 323 init1: 253 opt: 273 Z-score: 324.6 bits: 67.6 E(32554): 9.3e-12
Smith-Waterman score: 273; 35.9% identity (64.1% similar) in 128 aa overlap (111-238:122-246)
90 100 110 120 130 140
pF1KE6 DPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPKSRVELGQPNILICIVDNIFP
: :::.: :... : . :.:.: : ...:
CCDS47 KDILEEKRAVPDRMCRHNYELGGPMTLQRRVQPRVNVSPSKKGPLQHHNLLVCHVTDFYP
100 110 120 130 140 150
150 160 170 180 190 200
pF1KE6 PVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPL
:.. :. ::: : ::..:.. . : :. . .: ..:. ::: ::::: .::.:.
CCDS47 GSIQVRWFLNGQEETAGVVSTNLIRNGDWTFQILVMLEMTPQQGDVYTCQVEHTSLDSPV
160 170 180 190 200 210
210 220 230 240 250
pF1KE6 LRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLIIMGTYVSSVPR
.:. : .::. : :...::. :: .
CCDS47 TVEWKAQ---SDSARSKTLTGAGGFVLGLIICGVGIFMHRRSKKVQRGSA
220 230 240 250
>>CCDS78128.1 DQB2 gene_id:3120|Hs108|chr6 (264 aa)
initn: 184 init1: 146 opt: 262 Z-score: 311.6 bits: 65.3 E(32554): 4.9e-11
Smith-Waterman score: 266; 26.7% identity (56.4% similar) in 243 aa overlap (14-245:18-246)
10 20 30 40 50
pF1KE6 MALRAGLVLGFHTLMTLLSP-QEAGATKADHMGSYGPAFYQSYGAS-----GQFTH
:. : .: :: : . .. : . :. ... .
CCDS78 MALQIPGGFWAAAVTVMLVMLSTPVAEARDFPKDFLVQFKGMCYFTNGTERVRGVARYIY
10 20 30 40 50 60
60 70 80 90 100
pF1KE6 EFDEEQLFSVDLKKSEAVWRL----PEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRS
. .: :. :. . .:: .: ..... : : :.. . : :.. .
CCDS78 NREEYGRFDSDVGEFQAVTELGRSIEDWNNYKDFLEQER-AAVDKVCRHNYEAELRTTLQ
70 80 90 100 110
110 120 130 140 150 160
pF1KE6 RAINVPPRVTVLPKSRVE-LGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYS
: .: : ::. : ::.: :.. :.:.: : ...: :.. :.:: : : ::..::.
CCDS78 R--QVEPTVTISP-SRTEALNHHNLLVCSVTDFYPAQIKVRWFRNDQEETAGVVSTSLIR
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE6 QPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGL
. : :. . .: ..:. :.: ::::: .:..:. .:. : .:. .. ..:
CCDS78 NGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEWRAQ----SESAQSKMLSGIG-
180 190 200 210 220 230
230 240 250
pF1KE6 AIGLVGFLVGTVLIIMGTYVSSVPR
::..: ... .: .
CCDS78 -----GFVLGLIFLGLGLIIRHRGQKGPRGPPPAGLLH
240 250 260
>>CCDS56419.1 DQB2 gene_id:3120|Hs108|chr6 (227 aa)
initn: 177 init1: 141 opt: 258 Z-score: 308.0 bits: 64.4 E(32554): 7.8e-11
Smith-Waterman score: 258; 29.1% identity (56.8% similar) in 213 aa overlap (14-215:18-223)
10 20 30 40 50
pF1KE6 MALRAGLVLGFHTLMTLLSP-QEAGATKADHMGSYGPAFYQSYGAS-----GQFTH
:. : .: :: : . .. : . :. ... .
CCDS56 MALQIPGGFWAAAVTVMLVMLSTPVAEARDFPKDFLVQFKGMCYFTNGTERVRGVARYIY
10 20 30 40 50 60
60 70 80 90 100
pF1KE6 EFDEEQLFSVDLKKSEAVWRL----PEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRS
. .: :. :. . .:: .: ..... : : :.. . : :.. .
CCDS56 NREEYGRFDSDVGEFQAVTELGRSIEDWNNYKDFLEQER-AAVDKVCRHNYEAELRTTLQ
70 80 90 100 110
110 120 130 140 150 160
pF1KE6 RAINVPPRVTVLPKSRVE-LGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYS
: .: : ::. : ::.: :.. :.:.: : ...: :.. :.:: : : ::..::.
CCDS56 R--QVEPTVTISP-SRTEALNHHNLLVCSVTDFYPAQIKVRWFRNDQEETAGVVSTSLIR
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE6 QPDHLFRKFHYLPFVPSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGL
. : :. . .: ..:. :.: ::::: .:..:. .:. : :: :
CCDS56 NGDWTFQILVMLEITPQRGDIYTCQVEHPSLQSPITVEWR---PRGPPPAGLLH
180 190 200 210 220
230 240 250
pF1KE6 AIGLVGFLVGTVLIIMGTYVSSVPR
250 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Tue Nov 8 11:06:57 2016 done: Tue Nov 8 11:06:58 2016
Total Scan time: 1.640 Total Display time: -0.010
Function used was FASTA [36.3.4 Apr, 2011]