FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE0913, 254 aa
1>>>pF1KE0913 254 - 254 aa - 254 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5895+/-0.000852; mu= 13.0231+/- 0.051
mean_var=73.1291+/-14.339, 0's: 0 Z-trim(106.7): 61 B-trim: 3 in 1/52
Lambda= 0.149979
statistics sampled from 9061 (9124) to 9061 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.668), E-opt: 0.2 (0.28), width: 16
Scan time: 2.250
The best scores are: opt bits E(32554)
CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 1707 378.5 2.4e-105
CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 998 225.1 3.8e-59
CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 943 213.2 1.4e-55
CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 929 210.1 1.2e-54
CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 901 204.1 7.7e-53
CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 339 82.5 3.2e-16
CCDS4760.1 DMB gene_id:3109|Hs108|chr6 ( 263) 263 66.0 2.9e-11
>>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa)
initn: 1707 init1: 1707 opt: 1707 Z-score: 2004.6 bits: 378.5 E(32554): 2.4e-105
Smith-Waterman score: 1707; 100.0% identity (100.0% similar) in 254 aa overlap (1-254:1-254)
10 20 30 40 50 60
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGDEIFHVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGDEIFHVD
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE0 MAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNS
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE0 PVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFLP
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFLP
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE0 STEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIK
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 STEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIK
190 200 210 220 230 240
250
pF1KE0 GLRKSNAAERRGPL
::::::::::::::
CCDS47 GLRKSNAAERRGPL
250
>>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa)
initn: 1002 init1: 976 opt: 998 Z-score: 1175.4 bits: 225.1 E(32554): 3.8e-59
Smith-Waterman score: 998; 59.9% identity (80.6% similar) in 247 aa overlap (8-254:14-260)
10 20 30 40 50
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVIIQAEFYLNPDQSGEFMFDFDGD
.: . .: :.: . . ::: .:: : : . .:::::.:: :
CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDED
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 EIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEV
:.:.::. ::::::.:::::. ::::::.:::::. . ::. . .:::.: :: ::::
CCDS47 EMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPEV
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 TVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFH
::. . :::: .::.::: :::: :::.::::: ::. :: ::.:..:::: :. :.:::
CCDS47 TVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKFH
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 YLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIG
:: :.::.:: :::::::::::.::::::: . : .:::::.:.:::::..::::::.:
CCDS47 YLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIVG
190 200 210 220 230 240
240 250
pF1KE0 TIFIIKGLRKSNAAERRGPL
:..:::.::... . .: :
CCDS47 TVLIIKSLRSGHDPRAQGTL
250 260
>>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa)
initn: 1000 init1: 887 opt: 943 Z-score: 1111.3 bits: 213.2 E(32554): 1.4e-55
Smith-Waterman score: 943; 54.7% identity (78.9% similar) in 247 aa overlap (1-246:1-247)
10 20 30 40 50
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV-IIQAEFYLNPDQSGEFMFDFDGDEIFHV
::. . :::: . .:.: ::. : : .:. :: . ::.: .:: ...: :
CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN
:. :.:.:::: ::: :: :. ::.::.::. ::.:.:...::: . ::::.:::: .
CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL
: ::: .::.:::..:.. :::.:.::::::. :: ::..: : . ::::::::::::.
CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII
::.::::::.::::::: :::.:::...: : :.. :..::::::..::::...::..::
CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII
190 200 210 220 230 240
240 250
pF1KE0 KGLRKSNAAERRGPL
: :.
CCDS47 MGTYVSSVPR
250
>>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa)
initn: 931 init1: 913 opt: 929 Z-score: 1094.8 bits: 210.1 E(32554): 1.2e-54
Smith-Waterman score: 929; 53.3% identity (78.0% similar) in 255 aa overlap (1-254:1-255)
10 20 30 40 50
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV
: .. . .:: . ....:: . : .:: ...: ::.. .::::: :.:
CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN
:. .:::.:: ::..:..:. :::: :.:: : ::.:: :: : : :: :::::...
CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL
::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: ::
CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII
::....:::.:::::::.::::::: . :.:. : ::.:::::::.:::.::..::.:::
CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
240 250
pF1KE0 KGLRKSNAAERRGPL
.:::. .:....:::
CCDS47 QGLRSVGASRHQGPL
250
>>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa)
initn: 976 init1: 882 opt: 901 Z-score: 1062.1 bits: 204.1 E(32554): 7.7e-53
Smith-Waterman score: 901; 52.2% identity (77.3% similar) in 255 aa overlap (1-254:1-255)
10 20 30 40 50
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKEEHVI-IQAEFYLNPDQSGEFMFDFDGDEIFHV
: .. . .:: . ....:: . : .:: ..:: . ::.. .::::: :.:
CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV
10 20 30 40 50 60
60 70 80 90 100 110
pF1KE0 DMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTN
:. :::::.: :..: ::. :.:: :.:: : .::.: ..:: : :: :::::...
CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK
70 80 90 100 110 120
120 130 140 150 160 170
pF1KE0 SPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYLPFL
:: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: ::
CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL
130 140 150 160 170 180
180 190 200 210 220 230
pF1KE0 PSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFII
::....:::.::::::::::::::: . :.:. : ::..::::::.:::.::..::.:::
CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII
190 200 210 220 230 240
240 250
pF1KE0 KGLRKSNAAERRGPL
.:::. .:....: :
CCDS47 QGLRSVGASRHQGLL
250
>>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa)
initn: 199 init1: 126 opt: 339 Z-score: 404.7 bits: 82.5 E(32554): 3.2e-16
Smith-Waterman score: 341; 28.9% identity (58.1% similar) in 246 aa overlap (13-239:14-252)
10 20 30 40
pF1KE0 MAISGVPVLGFFIIAVLMSAQESWAIKE-----------EHVIIQAEFYLNPDQSGEFM
.. .: .:::. : .:..... . . . : .
CCDS47 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLS
10 20 30 40 50 60
50 60 70 80 90 100
pF1KE0 FDFDGDEIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKR-----SN
.: :..: :.... : :: ::. .: . :: : :: : : .. ..
CCDS47 EAYDEDQLFFFDFSQNTRVPRLPEFADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDG
70 80 90 100 110
110 120 130 140 150 160
pF1KE0 YTPITNVPPEVTVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFL
:.. : . :.: .:.:. .::.:.::.... ::...:.: ... :: : . : :.
CCDS47 KIPVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPVE-GFGPT-FV
120 130 140 150 160 170
170 180 190 200 210 220
pF1KE0 PREDHL-FRKFHYLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAP-SPLP-ETTENVVC
: : :. : :: : : :...: : : . .: .: . :: . :::.:
CCDS47 SAVDGLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLC
180 190 200 210 220 230
230 240 250
pF1KE0 ALGLTVGLVGIIIGTIFIIKGLRKSNAAERRGPL
.... .:..:::.: ..::
CCDS47 GVAFGLGVLGIIVGIVLIIYFRKPCSGD
240 250 260
>>CCDS4760.1 DMB gene_id:3109|Hs108|chr6 (263 aa)
initn: 241 init1: 137 opt: 263 Z-score: 315.8 bits: 66.0 E(32554): 2.9e-11
Smith-Waterman score: 263; 36.2% identity (59.1% similar) in 127 aa overlap (111-236:114-238)
90 100 110 120 130 140
pF1KE0 AQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTVLTNSPVELREPNVLICFIDKFTPP
:: : : ..: . ::: .: :.. : :
CCDS47 DTLMQRLRNGLQNCATHTQPFWGSLTNRTRPPSVQVAKTTPFNTREPVMLACYVWGFYPA
90 100 110 120 130 140
150 160 170 180 190
pF1KE0 VVNVTWLRNGKPVTTGVS-ETVFLPREDHLFRKFHYLPFLPSTEDVYDCRVEHWGLDEPL
:..:: .::: : : . . : : .. . .: . :: :.: : ::: : ::.
CCDS47 EVTITWRKNGKLVMPHSSAHKTAQPNGDWTYQTLSHLALTPSYGDTYTCVVEHTGAPEPI
150 160 170 180 190 200
200 210 220 230 240 250
pF1KE0 LKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTIFIIKGLRKSNAAERRGPL
:. : . ::. .: . : :. : .::. . .:.:
CCDS47 LRDWT-PGLSPM-QTLKVSVSAVTLGLGLIIFSLGVISWRRAGHSSYTPLPGSNYSEGWH
210 220 230 240 250 260
CCDS47 IS
254 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Sat Nov 5 04:28:26 2016 done: Sat Nov 5 04:28:27 2016
Total Scan time: 2.250 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]