FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011
Please cite:
W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448
Query: pF1KE1343, 261 aa
1>>>pF1KE1343 261 - 261 aa - 261 aa
Library: human.CCDS.faa
18511270 residues in 32554 sequences
Statistics: Expectation_n fit: rho(ln(x))= 5.5151+/-0.000785; mu= 14.1217+/- 0.047
mean_var=74.1647+/-15.254, 0's: 0 Z-trim(108.8): 32 B-trim: 0 in 0/53
Lambda= 0.148928
statistics sampled from 10446 (10476) to 10446 sequences
Algorithm: FASTA (3.7 Nov 2010) [optimized]
Parameters: BL50 matrix (15:-5), open/ext: -10/-2
ktup: 2, E-join: 1 (0.696), E-opt: 0.2 (0.322), width: 16
Scan time: 2.180
The best scores are: opt bits E(32554)
CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 1844 405.1 2.5e-113
CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 371 88.6 4.6e-18
CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 363 86.9 1.5e-17
CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 360 86.2 2.4e-17
CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 348 83.7 1.4e-16
CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 339 81.7 5.4e-16
>>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa)
initn: 1844 init1: 1844 opt: 1844 Z-score: 2148.0 bits: 405.1 E(32554): 2.5e-113
Smith-Waterman score: 1844; 100.0% identity (100.0% similar) in 261 aa overlap (1-261:1-261)
10 20 30 40 50 60
pF1KE1 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLS
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLS
10 20 30 40 50 60
70 80 90 100 110 120
pF1KE1 EAYDEDQLFFFDFSQNTRVPRLPEFADWAQEQGDAPAILFDKEFCEWMIQQIGPKLDGKI
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 EAYDEDQLFFFDFSQNTRVPRLPEFADWAQEQGDAPAILFDKEFCEWMIQQIGPKLDGKI
70 80 90 100 110 120
130 140 150 160 170 180
pF1KE1 PVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPVEGFGPTFVSAVD
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 PVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPVEGFGPTFVSAVD
130 140 150 160 170 180
190 200 210 220 230 240
pF1KE1 GLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYWVPRNALPSDLLENVLCGVAFGLG
::::::::::::::::::::::::::::::::::::::::::::::::::::::::::::
CCDS47 GLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYWVPRNALPSDLLENVLCGVAFGLG
190 200 210 220 230 240
250 260
pF1KE1 VLGIIVGIVLIIYFRKPCSGD
:::::::::::::::::::::
CCDS47 VLGIIVGIVLIIYFRKPCSGD
250 260
>>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa)
initn: 281 init1: 137 opt: 371 Z-score: 437.8 bits: 88.6 E(32554): 4.6e-18
Smith-Waterman score: 371; 30.7% identity (61.8% similar) in 241 aa overlap (20-252:7-240)
10 20 30 40 50
pF1KE1 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDL-QNHTFLHTV-YCQDGSPSVG
:: . :. . .: .:. .:. . : . :. .::
CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQ
10 20 30 40
60 70 80 90 100 110
pF1KE1 LSEAYDEDQLFFFDFSQNTRVPRLPEFADWAQ--EQGDAPAILFDKEFCEWMIQQIGPKL
.. .: :. :. :. . : .:: :. . . :. . :. :.:..:
CCDS47 YTHEFDGDEEFYVDLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQ-----
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE1 DGKIPVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNW--QHHSVPVEGFGPT
... .. : . ::. :. .:.::::.:.:.:.:::.....: . ::: .:: . :
CCDS47 SNSTAATNEVPEVTVFSKFPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSV-TEGVSET
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE1 -FVSAVDGLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYWVPRNALP-SDLLENVL
:.: : :: .:::.: : ..:..: : : . .: :. : :.: :...
CCDS47 SFLSKSDH-SFFKISYLTFLPSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLV
170 180 190 200 210 220
240 250 260
pF1KE1 CGVAFGLGVLGIIVGIVLIIYFRKPCSGD
:......:..::.:: :.::
CCDS47 CALGLSVGLMGIVVGTVFIIQGLRSVGASRHQGLL
230 240 250
>>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa)
initn: 262 init1: 102 opt: 363 Z-score: 428.6 bits: 86.9 E(32554): 1.5e-17
Smith-Waterman score: 363; 32.2% identity (63.0% similar) in 211 aa overlap (49-252:38-240)
20 30 40 50 60 70
pF1KE1 WLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTR
. :. . : ... .::.::: :....
CCDS47 VLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSVDLKKSEA
10 20 30 40 50 60
80 90 100 110 120 130
pF1KE1 VPRLPEFADWAQ--EQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKP
: :::::.:.:. :: .: : . .... . . ..: : . :. .
CCDS47 VWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVP-----PRVTVLPKSR
70 80 90 100 110 120
140 150 160 170 180 190
pF1KE1 LEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPT-FVSAVDGLSFQAFSYLNFTP
.:.:.:: :.:.:.:.:::.....: ... : :: . : : : : : :. : :: :.:
CCDS47 VELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHL-FRKFHYLPFVP
130 140 150 160 170 180
200 210 220 230 240 250
pF1KE1 EPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLCGVAFGLGVLGIIVGIVLI
:...: : : . .: :: : : .:...:......:..:..:: :::
CCDS47 SAEDVYDCQVEHWGLDAPLLRHWELQVP--IPPPDAMETLVCALGLAIGLVGFLVGTVLI
190 200 210 220 230
260
pF1KE1 IYFRKPCSGD
:
CCDS47 IMGTYVSSVPR
240 250
>>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa)
initn: 345 init1: 141 opt: 360 Z-score: 425.0 bits: 86.2 E(32554): 2.4e-17
Smith-Waterman score: 360; 32.0% identity (63.1% similar) in 203 aa overlap (55-252:44-240)
30 40 50 60 70 80
pF1KE1 WAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTRVPRLPE
:: .. .: :. :. :. .. . : ::
CCDS47 LTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYVDLERKETAWRWPE
20 30 40 50 60 70
90 100 110 120 130 140
pF1KE1 FADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKPLEFGKP
:. .. . :: . :. . ::.. . . .. : . ::. .:. .:.:
CCDS47 FSKFGGFDPQGALRNMAVAKHNLNIMIKRYN-----STAATNEVPEVTVFSKSPVTLGQP
80 90 100 110 120
150 160 170 180 190 200
pF1KE1 NTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPT-FVSAVDGLSFQAFSYLNFTPEPSDIF
:::.:.:.:.:::.....: .. : :: . : :.: : :: .:::.: : ..:.
CCDS47 NTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDH-SFFKISYLTFLPSADEIY
130 140 150 160 170 180
210 220 230 240 250
pF1KE1 SCIVTHEIDRYTAIAYWVPRNALP-SDLLENVLCGVAFGLGVLGIIVGIVLIIYFRKPCS
.: : : . .: :. : :.: :.:.:......:..::.:: :.::
CCDS47 DCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFIIQGLRSVG
190 200 210 220 230 240
260
pF1KE1 GD
CCDS47 ASRHQGPL
250
>>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa)
initn: 347 init1: 140 opt: 348 Z-score: 410.9 bits: 83.7 E(32554): 1.4e-16
Smith-Waterman score: 348; 29.6% identity (61.1% similar) in 216 aa overlap (41-252:35-245)
20 30 40 50 60 70
pF1KE1 LLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFF
.:. .... : :. . .:::..:.
CCDS47 DRMFHIRAVILRALSLAFLLSLRGAGAIKADHVSTYAAFVQTHRPTGEFMFEFDEDEMFY
10 20 30 40 50 60
80 90 100 110 120
pF1KE1 FDFSQNTRVPRLPEFADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPI
:.... : .: ::.. . :: : . .. . .::. ... .. :
CCDS47 VDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQR-----SNHTQATNDPPE
70 80 90 100 110
130 140 150 160 170 180
pF1KE1 AEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPV-EGFGPTFVSAVDGLSFQAF
. :: .:.:.:.::::.: ....:::.:.:.: .. : :: . .. ::. :
CCDS47 VTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKF
120 130 140 150 160 170
190 200 210 220 230 240
pF1KE1 SYLNFTPEPSDIFSCIVTHEIDRYTAIAYWVPRNALP-SDLLENVLCGVAFGLGVLGIIV
::.:.: :...: : : . .: .. . . :.:::.... ::..::::
CCDS47 HYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV
180 190 200 210 220 230
250 260
pF1KE1 GIVLIIYFRKPCSGD
: ::::
CCDS47 GTVLIIKSLRSGHDPRAQGTL
240 250 260
>>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa)
initn: 199 init1: 126 opt: 339 Z-score: 400.6 bits: 81.7 E(32554): 5.4e-16
Smith-Waterman score: 341; 28.9% identity (58.1% similar) in 246 aa overlap (14-252:13-239)
10 20 30 40 50 60
pF1KE1 MGHEQNQGAALLQMLPLLWLLPHSWAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLS
.. .: .:::. : .:..... . . . : .
CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKE-----------EHVIIQAEFYLNPDQSGEFM
10 20 30 40
70 80 90 100 110
pF1KE1 EAYDEDQLFFFDFSQNTRVPRLPEFADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDG
.: :..: :.... : :: ::. .: . :: : :: : : .. ..
CCDS47 FDFDGDEIFHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKR-----SN
50 60 70 80 90 100
120 130 140 150 160 170
pF1KE1 KIPVSRGFPIAEVFTLKPLEFGKPNTLVCFVSNLFPPMLTVNWQHHSVPVE-GFGPT-FV
:.. : . :.: .:.:. .::.:.::.... ::...:.: ... :: : . : :.
CCDS47 YTPITNVPPEVTVLTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFL
110 120 130 140 150 160
180 190 200 210 220 230
pF1KE1 SAVDGLSFQAFSYLNFTPEPSDIFSCIVTHEIDRYTAIAYW---VPRNALPSDLLENVLC
: : :. : :: : : :...: : : . .: .: . :: . :::.:
CCDS47 PREDHL-FRKFHYLPFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAP-SPLP-ETTENVVC
170 180 190 200 210 220
240 250 260
pF1KE1 GVAFGLGVLGIIVGIVLIIYFRKPCSGD
.... .:..:::.: ..::
CCDS47 ALGLTVGLVGIIIGTIFIIKGLRKSNAAERRGPL
230 240 250
261 residues in 1 query sequences
18511270 residues in 32554 library sequences
Tcomplib [36.3.4 Apr, 2011] (8 proc)
start: Mon Nov 7 01:50:42 2016 done: Mon Nov 7 01:50:43 2016
Total Scan time: 2.180 Total Display time: 0.000
Function used was FASTA [36.3.4 Apr, 2011]