FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KE1299, 255 aa 1>>>pF1KE1299 255 - 255 aa - 255 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 5.5796+/-0.000819; mu= 12.8105+/- 0.049 mean_var=67.0212+/-13.570, 0's: 0 Z-trim(106.5): 47 B-trim: 3 in 1/50 Lambda= 0.156664 statistics sampled from 8990 (9037) to 8990 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.661), E-opt: 0.2 (0.278), width: 16 Scan time: 2.140 The best scores are: opt bits E(32554) CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 ( 255) 1697 392.3 1.7e-109 CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 ( 255) 1514 351.0 4.7e-97 CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 ( 260) 970 228.0 4.9e-60 CCDS4763.1 DOA gene_id:3111|Hs108|chr6 ( 250) 958 225.3 3.1e-59 CCDS4750.1 DRA gene_id:3122|Hs108|chr6 ( 254) 938 220.8 7.2e-58 CCDS4761.1 DMA gene_id:3108|Hs108|chr6 ( 261) 362 90.6 1.1e-18 >>CCDS4752.1 DQA1 gene_id:3117|Hs108|chr6 (255 aa) initn: 1697 init1: 1697 opt: 1697 Z-score: 2079.5 bits: 392.3 E(32554): 1.7e-109 Smith-Waterman score: 1697; 98.0% identity (100.0% similar) in 255 aa overlap (1-255:1-255) 10 20 30 40 50 60 pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV :::::::::::::::::::::::::::::::::::::::::::::::.:::::::::::: CCDS47 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQYTHEFDGDEQFYV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK :::.:::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS47 DLERKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL :::::::::::::::::::::::::::::::..::::::::::::::::::::::::::: CCDS47 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGQSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII :::::::::::::::::::::::::::::::::::::::::::::::::.:::::::::: CCDS47 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 250 pF1KE1 QGLRSVGASRHQGPL ::::::::::::::: CCDS47 QGLRSVGASRHQGPL 250 >>CCDS4753.1 DQA2 gene_id:3118|Hs108|chr6 (255 aa) initn: 1514 init1: 1514 opt: 1514 Z-score: 1855.9 bits: 351.0 E(32554): 4.7e-97 Smith-Waterman score: 1514; 88.6% identity (96.5% similar) in 255 aa overlap (1-255:1-255) 10 20 30 40 50 60 pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV :::::::::::::::.::::::::::::::::: :::.:: .:::::.::::::::.::: CCDS47 MILNKALLLGALALTAVMSPCGGEDIVADHVASYGVNFYQSHGPSGQYTHEFDGDEEFYV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK ::: :::.:. : :::: .::::.:::::::.::.:..:... ::::::::::::::::: CCDS47 DLETKETVWQLPMFSKFISFDPQSALRNMAVGKHTLEFMMRQSNSTAATNEVPEVTVFSK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL :::::::::::::::::::::::::::::::.::::::::::::::::::::::::::: CCDS47 FPVTLGQPNTLICLVDNIFPPVVNITWLSNGHSVTEGVSETSFLSKSDHSFFKISYLTFL 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII :::::::::::::::::.::::::::::::::::::::.::::::::::.:::::::::: CCDS47 PSADEIYDCKVEHWGLDEPLLKHWEPEIPAPMSELTETLVCALGLSVGLMGIVVGTVFII 190 200 210 220 230 240 250 pF1KE1 QGLRSVGASRHQGPL ::::::::::::: : CCDS47 QGLRSVGASRHQGLL 250 >>CCDS4764.1 DPA1 gene_id:3113|Hs108|chr6 (260 aa) initn: 925 init1: 888 opt: 970 Z-score: 1191.3 bits: 228.0 E(32554): 4.9e-60 Smith-Waterman score: 970; 57.6% identity (78.8% similar) in 255 aa overlap (1-255:7-260) 10 20 30 40 50 pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDG :. .:..: ::.:. ..: :. : :::: : . . : . :.:.: ::: CCDS47 MRPEDRMFHIRAVILRALSLAFLLSLRGAGAIKADHV-STYAAFVQTHRPTGEFMFEFDE 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 DEQFYVDLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPE ::.:::::.::::.:. ::.. .:. ::.: :.:. ..::: .:.: : : :::. :: CCDS47 DEMFYVDLDKKETVWHLEEFGQAFSFEAQGGLANIAILNNNLNTLIQRSNHTQATNDPPE 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 VTVFSKSPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKI :::: : :: ::::::::: .:..::::.:.::: ::. :::::.:. :: ..:.:: :. CCDS47 VTVFPKEPVELGQPNTLICHIDKFFPPVLNVTWLCNGELVTEGVAESLFLPRTDYSFHKF 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 SYLTFLPSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVV ::::.:::...:::.::::::::::::::: . : : : ::::.::::: .:::::.: CCDS47 HYLTFVPSAEDFYDCRVEHWGLDQPLLKHWEAQEPIQMPETTETVLCALGLVLGLVGIIV 180 190 200 210 220 230 240 250 pF1KE1 GTVFIIQGLRSVGASRHQGPL :::.::..::: : :: : CCDS47 GTVLIIKSLRSGHDPRAQGTL 240 250 260 >>CCDS4763.1 DOA gene_id:3111|Hs108|chr6 (250 aa) initn: 965 init1: 943 opt: 958 Z-score: 1176.9 bits: 225.3 E(32554): 3.1e-59 Smith-Waterman score: 958; 57.4% identity (79.3% similar) in 242 aa overlap (1-242:1-242) 10 20 30 40 50 60 pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYV : : .:.:: .: :..:: . :::..: : .:: :: ::::::::: .. : : CCDS47 MALRAGLVLGFHTLMTLLSPQEAGATKADHMGSYGPAFYQSYGASGQFTHEFDEEQLFSV 10 20 30 40 50 60 70 80 90 100 110 120 pF1KE1 DLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTVFSK ::.:.:..:: :::. :. :::::.: ..:. : .:.:...: : . : : :.:::. : CCDS47 DLKKSEAVWRLPEFGDFARFDPQGGLAGIAAIKAHLDILVERSNRSRAINVPPRVTVLPK 70 80 90 100 110 120 130 140 150 160 170 180 pF1KE1 SPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYLTFL : : ::::: :::.::::::::.::::: ::..:::::..::: :. :: : :. :: :. CCDS47 SRVELGQPNILICIVDNIFPPVINITWLRNGQTVTEGVAQTSFYSQPDHLFRKFHYLPFV 130 140 150 160 170 180 190 200 210 220 230 240 pF1KE1 PSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFII :::...:::.::::::: :::.::: ..: : . ::.::::::..::::..::::.:: CCDS47 PSAEDVYDCQVEHWGLDAPLLRHWELQVPIPPPDAMETLVCALGLAIGLVGFLVGTVLII 190 200 210 220 230 240 250 pF1KE1 QGLRSVGASRHQGPL .: CCDS47 MGTYVSSVPR 250 >>CCDS4750.1 DRA gene_id:3122|Hs108|chr6 (254 aa) initn: 940 init1: 922 opt: 938 Z-score: 1152.4 bits: 220.8 E(32554): 7.2e-58 Smith-Waterman score: 938; 54.7% identity (77.9% similar) in 258 aa overlap (1-255:1-254) 10 20 30 40 50 pF1KE1 MILNKALLLGALALTTVMSPCGGEDIVADHVASCGVNLYQFY-GP--SGQFTHEFDGDEQ : .. . .:: . ....:: . : .:: . .:: .: ::.: .::::: CCDS47 MAISGVPVLGFFIIAVLMSAQESWAIKEEHV----IIQAEFYLNPDQSGEFMFDFDGDEI 10 20 30 40 50 60 70 80 90 100 110 pF1KE1 FYVDLEKKETAWRWPEFSKFGGFDPQGALRNMAVAKHNLNIMIKRYNSTAATNEVPEVTV :.::. ::::.:: ::..:..:. :::: :.:: : ::.:: :: : : :: ::::: CCDS47 FHVDMAKKETVWRLEEFGRFASFEAQGALANIAVDKANLEIMTKRSNYTPITNVPPEVTV 60 70 80 90 100 110 120 130 140 150 160 170 pF1KE1 FSKSPVTLGQPNTLICLVDNIFPPVVNITWLSNGHAVTEGVSETSFLSKSDHSFFKISYL ...::: : .::.:::..:.. :::::.::: ::. :: ::::: :: . :: : :. :: CCDS47 LTNSPVELREPNVLICFIDKFTPPVVNVTWLRNGKPVTTGVSETVFLPREDHLFRKFHYL 120 130 140 150 160 170 180 190 200 210 220 230 pF1KE1 TFLPSADEIYDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTV ::::....:::.:::::::.::::::: . :.:. : ::.:::::::.::::::..::. CCDS47 PFLPSTEDVYDCRVEHWGLDEPLLKHWEFDAPSPLPETTENVVCALGLTVGLVGIIIGTI 180 190 200 210 220 230 240 250 pF1KE1 FIIQGLRSVGASRHQGPL :::.:::. .:....::: CCDS47 FIIKGLRKSNAAERRGPL 240 250 >>CCDS4761.1 DMA gene_id:3108|Hs108|chr6 (261 aa) initn: 346 init1: 141 opt: 362 Z-score: 448.6 bits: 90.6 E(32554): 1.1e-18 Smith-Waterman score: 362; 32.4% identity (64.2% similar) in 204 aa overlap (44-240:55-252) 20 30 40 50 60 70 pF1KE1 LTTVMSPCGGEDIVADHVASCGVNLYQFYGPSGQFTHEFDGDEQFYVDLEKKETAWRWPE :: ... .: :. :. :. .. . : :: CCDS47 WAVPEAPTPMWPDDLQNHTFLHTVYCQDGSPSVGLSEAYDEDQLFFFDFSQNTRVPRLPE 30 40 50 60 70 80 80 90 100 110 120 pF1KE1 FSKFGGFDPQGALRNMAVAKHNLNIMIKRYN-----STAATNEVPEVTVFSKSPVTLGQP :. .. . :: . :. . ::.. . . .. : . ::. .:. .:.: CCDS47 FADWA--QEQGDAPAILFDKEFCEWMIQQIGPKLDGKIPVSRGFPIAEVFTLKPLEFGKP 90 100 110 120 130 140 130 140 150 160 170 180 pF1KE1 NTLICLVDNIFPPVVNITWLSNGHAV-TEGVSETSFLSKSDH-SFFKISYLTFLPSADEI :::.:.:.:.:::.....: . :.: .:: . : :.: : :: .:::.: : ..: CCDS47 NTLVCFVSNLFPPMLTVNW--QHHSVPVEGFGPT-FVSAVDGLSFQAFSYLNFTPEPSDI 150 160 170 180 190 190 200 210 220 230 240 pF1KE1 YDCKVEHWGLDQPLLKHWEPEIPAPMSELTETVVCALGLSVGLVGIVVGTVFIIQGLRSV ..: : : . .: :. : :.: :.:.:......:..::.:: :.:: CCDS47 FSCIVTHEIDRYTAIAYWVPRNALP-SDLLENVLCGVAFGLGVLGIIVGIVLIIYFRKPC 200 210 220 230 240 250 250 pF1KE1 GASRHQGPL CCDS47 SGD 260 255 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Sun Nov 6 20:36:22 2016 done: Sun Nov 6 20:36:22 2016 Total Scan time: 2.140 Total Display time: -0.010 Function used was FASTA [36.3.4 Apr, 2011]