FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB9871, 490 aa 1>>>pF1KB9871 490 - 490 aa - 490 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 10.2645+/-0.00098; mu= -2.7553+/- 0.058 mean_var=408.5914+/-90.387, 0's: 0 Z-trim(116.6): 698 B-trim: 0 in 0/53 Lambda= 0.063450 statistics sampled from 16385 (17203) to 16385 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.805), E-opt: 0.2 (0.528), width: 16 Scan time: 3.740 The best scores are: opt bits E(32554) CCDS5372.1 SP8 gene_id:221833|Hs108|chr7 ( 490) 3389 324.3 1.9e-88 CCDS43555.1 SP8 gene_id:221833|Hs108|chr7 ( 508) 3389 324.3 1.9e-88 CCDS46453.1 SP9 gene_id:100131390|Hs108|chr2 ( 484) 1512 152.5 9.8e-37 CCDS73475.1 SP7 gene_id:121340|Hs108|chr12 ( 413) 808 87.9 2.2e-17 CCDS44897.1 SP7 gene_id:121340|Hs108|chr12 ( 431) 808 88.0 2.3e-17 CCDS11520.1 SP6 gene_id:80320|Hs108|chr17 ( 376) 757 83.2 5.3e-16 CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 ( 778) 682 76.7 1e-13 CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 ( 785) 682 76.7 1e-13 CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 ( 784) 663 75.0 3.3e-13 CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 ( 398) 653 73.7 4.1e-13 CCDS46452.1 SP3 gene_id:6670|Hs108|chr2 ( 713) 657 74.4 4.6e-13 CCDS2254.1 SP3 gene_id:6670|Hs108|chr2 ( 781) 657 74.4 4.9e-13 CCDS10025.1 KLF13 gene_id:51621|Hs108|chr15 ( 288) 581 67.0 3.2e-11 >>CCDS5372.1 SP8 gene_id:221833|Hs108|chr7 (490 aa) initn: 3389 init1: 3389 opt: 3389 Z-score: 1701.5 bits: 324.3 E(32554): 1.9e-88 Smith-Waterman score: 3389; 100.0% identity (100.0% similar) in 490 aa overlap (1-490:1-490) 10 20 30 40 50 60 pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGAS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGAS 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB9 RNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 RNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSP 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFISKVHTSVDGLQGIYPRVG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFISKVHTSVDGLQGIYPRVG 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB9 MAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAALPGSLHPAAGGL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 MAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAALPGSLHPAAGGL 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB9 QTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLA :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 QTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLA 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB9 GAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 GAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHI 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB9 PGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 PGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB9 CNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS53 CNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQP 430 440 450 460 470 480 490 pF1KB9 PEPGHRNGLE :::::::::: CCDS53 PEPGHRNGLE 490 >>CCDS43555.1 SP8 gene_id:221833|Hs108|chr7 (508 aa) initn: 3389 init1: 3389 opt: 3389 Z-score: 1701.3 bits: 324.3 E(32554): 1.9e-88 Smith-Waterman score: 3389; 100.0% identity (100.0% similar) in 490 aa overlap (1-490:19-508) 10 20 30 40 pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSA :::::::::::::::::::::::::::::::::::::::::: CCDS43 MATSLLGEEPRLGSTPLAMLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSA 10 20 30 40 50 60 50 60 70 80 90 100 pF1KB9 SCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTS 70 80 90 100 110 120 110 120 130 140 150 160 pF1KB9 SSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVFI 130 140 150 160 170 180 170 180 190 200 210 220 pF1KB9 SKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 SKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAGWIDVQN 190 200 210 220 230 240 230 240 250 260 270 280 pF1KB9 PNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 PNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSPAGQHLMDG 250 260 270 280 290 300 290 300 310 320 330 340 pF1KB9 FKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAER :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 FKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATCDCPNCQEAER 310 320 330 340 350 360 350 360 370 380 390 400 pF1KB9 LGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDE 370 380 390 400 410 420 410 420 430 440 450 460 pF1KB9 LQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDS :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS43 LQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDS 430 440 450 460 470 480 470 480 490 pF1KB9 EHSAAGSPPCHSPELLQPPEPGHRNGLE :::::::::::::::::::::::::::: CCDS43 EHSAAGSPPCHSPELLQPPEPGHRNGLE 490 500 >>CCDS46453.1 SP9 gene_id:100131390|Hs108|chr2 (484 aa) initn: 1415 init1: 1000 opt: 1512 Z-score: 773.0 bits: 152.5 E(32554): 9.8e-37 Smith-Waterman score: 1678; 58.7% identity (74.1% similar) in 491 aa overlap (1-478:19-444) 10 20 30 40 pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKG-FHPWKRSSSSSS ::::::::::. :: ..: .::. :.:: :::::::::: CCDS46 MATSILGEEPRFGTTPLAMLAATCNKIGNTSPL-TTLPESSA-FAKGGFHPWKRSSSS-- 10 20 30 40 50 50 60 70 80 90 100 pF1KB9 ASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLT ::. :::::.:.:. .:: .:.. :....:: .: .... :: ::::: CCDS46 --CNL-GSSLSGFAVA----TGGRGSGGLAGGSGAANSAFCLAST-----SPTSSAFSSD 60 70 80 90 100 110 120 130 140 150 160 pF1KB9 SSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSHQPVF .. . .:::::::. ::: .:: : .: CCDS46 YGGLFSNSAAAAAAAA--------------GVSPQEAGG-----------------QSAF 110 120 130 170 180 190 200 210 pF1KB9 ISKVHTSVDGLQGIYPRVGMAHPYESWFKPSHPGLGAAGEVGSAGASSWWDVGAG---WI ::::::.. .:.:::::::::::::.: . . ::::: ...::::::: .. :. CCDS46 ISKVHTTA--ADGLYPRVGMAHPYESWYKSGFHSTLAAGEVTNGAASSWWDVHSSPGSWL 140 150 160 170 180 190 220 230 240 250 260 270 pF1KB9 DVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSS-------GASSHL .:::: :..: .::: .:. :.:::: :: :: :.:.:.:::::: .:.::: CCDS46 EVQNP--AGGLQSSLH--SGAPQASLHSQLGTYNPDFSSLTHSAFSSTGLGSSAAAASHL 200 210 220 230 240 280 290 300 310 320 pF1KB9 LSPAGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGR :: . :::. :::::::: :: ::. . :.:...:.:.. .: ::: :::::::: CCDS46 LSTS-QHLLAQDGFKPVLP-SYSDSSAAVAAAAASAMISGAAAAAAGGSSARSARRYSGR 250 260 270 280 290 300 330 340 350 360 370 380 pF1KB9 ATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS46 ATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCN 310 320 330 340 350 360 390 400 410 420 430 440 pF1KB9 WLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAG :::::::::::::::::::::::::::::::::::::::::::::.:::.::::: CCDS46 WLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHIKTHNGGGGG----- 370 380 390 400 410 420 450 460 470 480 490 pF1KB9 SGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE :::::.:.. : .: .::.:. CCDS46 -----KKGSDSDTDASNLETPRSESPDLILHDSGVSAARAAAAAAAAAAAAAAAASAGGK 430 440 450 460 470 >>CCDS73475.1 SP7 gene_id:121340|Hs108|chr12 (413 aa) initn: 758 init1: 702 opt: 808 Z-score: 425.5 bits: 87.9 E(32554): 2.2e-17 Smith-Waterman score: 982; 40.6% identity (64.5% similar) in 431 aa overlap (72-490:4-412) 50 60 70 80 90 100 pF1KB9 ASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLT :: . .... . :: . : . .. .:. CCDS73 MLTAACSKFGGSSPLRDSTTLGKAGTKKPYSVG 10 20 30 110 120 130 140 150 pF1KB9 SSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHS---QDGSHQ :. .:. . . : : ::.. ... .:. : . .: .. .:: :... CCDS73 SDLSASKTMGDAYPA---PFTSTNGLL-SPAGSPPAPTSGYANDYPPFSHSFPGPTGTQD 40 50 60 70 80 160 170 180 190 200 210 pF1KB9 P-VFISKVHTSVDGLQGIYPRVGMAHPYESWFKPS-HPGLGAAGEVGSAGASSWWDV--G : ... : :.: : : ..: . :.::: ::.: . : :. . : :.. . :::. : CCDS73 PGLLVPKGHSSSDCLPSVYTSLDMTHPYGSWYKAGIHAGI-SPGP-GNT-PTPWWDMHPG 90 100 110 120 130 140 220 230 240 250 260 270 pF1KB9 AGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSSGASSHLLSP ..:. . ... .: :.: :. : : :. : : ::.. :. . . . :::.: CCDS73 GNWLG-GGQGQGDGLQGTL-PT-GPAQPPLNPQLPTYPSDFAPLNPAPY---PAPHLLQP 150 160 170 180 190 200 280 290 300 310 320 330 pF1KB9 AGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSARRYSGRATC . ::.. : .:: :. . : :.::. : :. .:. .:. .::..: CCDS73 GPQHVLPQDVYKPKAVGN-----SGQLEGSGGAKPPRGASTGGSGGYGGSG---AGRSSC 210 220 230 240 250 340 350 360 370 380 390 pF1KB9 DCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFVCNWLF ::::::: :::: :.:.::.: .::::::::::::::.:::::::::::::::::::::: CCDS73 DCPNCQELERLGAAAAGLRKKPIHSCHIPGCGKVYGKASHLKAHLRWHTGERPFVCNWLF 260 270 280 290 300 310 400 410 420 430 440 450 pF1KB9 CGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGSAGS-- :::::::::::.::.:::: ::.:.: .:.::: :::::::: .::. : : .: CCDS73 CGKRFTRSDELERHVRTHTREKKFTCLLCSKRFTRSDHLSKHQRTHGEPGPGPPPSGPKE 320 330 340 350 360 370 460 470 480 490 pF1KB9 -GSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE : : . : . :. .. : .:: : . : :: CCDS73 LGEGRSTGEEEASQTPRPSASPA-TPEKAPGGSPEQSNLLEI 380 390 400 410 >>CCDS44897.1 SP7 gene_id:121340|Hs108|chr12 (431 aa) initn: 758 init1: 702 opt: 808 Z-score: 425.3 bits: 88.0 E(32554): 2.3e-17 Smith-Waterman score: 993; 40.5% identity (64.3% similar) in 440 aa overlap (63-490:13-430) 40 50 60 70 80 90 pF1KB9 WKRSSSSSSASCNVVGSSLSSFGVSGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGS :.: : .:: . .... . :: . : . CCDS44 MASSLLEEEVHYGSSPLAMLTAACSKFGGSSPLRDSTTLGKA 10 20 30 40 100 110 120 130 140 150 pF1KB9 PGSSAFSLTSSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGGSSAHS .. .:. :. .:. . . : : ::.. ... .:. : . .: .. .:: CCDS44 GTKKPYSVGSDLSASKTMGDAYPA---PFTSTNGLL-SPAGSPPAPTSGYANDYPPFSHS 50 60 70 80 90 160 170 180 190 200 pF1KB9 ---QDGSHQP-VFISKVHTSVDGLQGIYPRVGMAHPYESWFKPS-HPGLGAAGEVGSAGA :...: ... : :.: : : ..: . :.::: ::.: . : :. . : :.. CCDS44 FPGPTGTQDPGLLVPKGHSSSDCLPSVYTSLDMTHPYGSWYKAGIHAGI-SPGP-GNT-P 100 110 120 130 140 150 210 220 230 240 250 260 pF1KB9 SSWWDV--GAGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSAFSS . :::. :..:. . ... .: :.: :. : : :. : : ::.. :. . . . CCDS44 TPWWDMHPGGNWLG-GGQGQGDGLQGTL-PT-GPAQPPLNPQLPTYPSDFAPLNPAPYPA 160 170 180 190 200 210 270 280 290 300 310 320 pF1KB9 GASSHLLSPAGQHLM--DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGGSPRSSA :::.:. ::.. : .:: :. . : :.::. : :. .:. .:. CCDS44 ---PHLLQPGPQHVLPQDVYKPKAVGN-----SGQLEGSGGAKPPRGASTGGSGGYGGSG 220 230 240 250 260 330 340 350 360 370 380 pF1KB9 RRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGE .::..:::::::: :::: :.:.::.: .::::::::::::::.::::::::::::: CCDS44 ---AGRSSCDCPNCQELERLGAAAAGLRKKPIHSCHIPGCGKVYGKASHLKAHLRWHTGE 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB9 RPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGG ::::::::::::::::::::.::.:::: ::.:.: .:.::: :::::::: .::. : CCDS44 RPFVCNWLFCGKRFTRSDELERHVRTHTREKKFTCLLCSKRFTRSDHLSKHQRTHGEPGP 330 340 350 360 370 380 450 460 470 480 490 pF1KB9 GGGSAGS---GSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE : .: : : . : . :. .. : .:: : . : :: CCDS44 GPPPSGPKELGEGRSTGEEEASQTPRPSASPA-TPEKAPGGSPEQSNLLEI 390 400 410 420 430 >>CCDS11520.1 SP6 gene_id:80320|Hs108|chr17 (376 aa) initn: 920 init1: 571 opt: 757 Z-score: 400.7 bits: 83.2 E(32554): 5.3e-16 Smith-Waterman score: 884; 45.0% identity (64.3% similar) in 353 aa overlap (118-458:36-356) 90 100 110 120 130 140 pF1KB9 SCGGSPGSSAFSLTSSSAAAAAAAAAAAASSSPFANDYSVFQAPGVSGGSGGGGGGGGGG .:: :.:: :: .. : CCDS11 CGSLGSQHTEAPHASPPRLDLQPLQTYQGHTSPEAGDYPSPLQPGEL--QSLPLGPEVDF 10 20 30 40 50 60 150 160 170 180 190 200 pF1KB9 SSAHSQDGSHQPVFISKVHTSVDGLQGIYPRV---GMAHPYESWFKPSHPGLGAAGEVGS :... :. . : .... : . .. :.: :::::.:.::: .: :: CCDS11 SQGYELPGASSRVTCEDLESDSPLAPGPFSKLLQPDMSHHYESWFRPTHPG----AEDGS 70 80 90 100 110 210 220 230 240 250 260 pF1KB9 AGASSWWDV--GAGWIDVQNPNSAAALPGSLHPAAGGLQTSLHSPLGGYNSDYSGLSHSA :::. :..:.:. . ..: . :: :: :.::..: ::: .:.. : CCDS11 -----WWDLHPGTSWMDLPHTQGALTSPG--HP--GALQAGL----GGYVGDHQ---LCA 120 130 140 150 160 270 280 290 300 310 pF1KB9 FSSGASSHLLSPA--GQHLM---DGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAPLGG .: : :: ::::. :: : .: . :.: : .:. : . : :. CCDS11 PPPHPHAHHLLPAAGGQHLLGPPDGAK-ALEVAAPESQ-----GLDSSL--DGAARPKGS 170 180 190 200 210 320 330 340 350 360 370 pF1KB9 SPRSSARRYSGRATCDCPNCQEAERLG-PAGASL-RRKGLHSCHIPGCGKVYGKTSHLKA : :. : ::...: :::: :::::: : : . ..: ::.::::::::.:.::::::: CCDS11 --RRSVPRSSGQTVCRCPNCLEAERLGAPCGPDGGKKKHLHNCHIPGCGKAYAKTSHLKA 220 230 240 250 260 270 380 390 400 410 420 430 pF1KB9 HLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHV :::::.:.::::::::::::::::::::::::.:::: :.: : ::.. :::::::.::. CCDS11 HLRWHSGDRPFVCNWLFCGKRFTRSDELQRHLQTHTGTKKFPCAVCSRVFMRSDHLAKHM 280 290 300 310 320 330 440 450 460 470 480 490 pF1KB9 KTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE ::: :. ...:.:: : :. CCDS11 KTHEGAKEEAAGAASGEGKAGGAVEPPGGKGKREAEGSVAPSN 340 350 360 370 >>CCDS44898.1 SP1 gene_id:6667|Hs108|chr12 (778 aa) initn: 820 init1: 579 opt: 682 Z-score: 359.9 bits: 76.7 E(32554): 1e-13 Smith-Waterman score: 726; 33.6% identity (60.3% similar) in 473 aa overlap (36-470:266-733) 10 20 30 40 50 60 pF1KB9 CNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGASR-NGG :... . : ..: : :. ::.. ..: CCDS44 NNVLSGQTQYVTNVPVALNGNITLLPVNSVSAATLTPSSQAVTISSSGSQESGSQPVTSG 240 250 260 270 280 290 70 80 90 100 110 120 pF1KB9 SSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSL----TSSSAAAAAAAAAAAASSSP .. ..:. ... :..... ... : . . .: ... ::.:... . . . :. CCDS44 TTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSGL 300 310 320 330 340 350 130 140 150 160 170 pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSH--QPVFISKVHTSVDGLQGIYPR ..: .: .:::: .: : .. ..:. . :: .. . ....::. : CCDS44 QGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLV-QGGQALQALQAA-PL 360 370 380 390 400 410 180 190 200 210 220 pF1KB9 VGMAHPYESWFK-----------P-SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSA :.. .. . : : : . . :: : :: . ..::::.. CCDS44 SGQTFTTQAISQETLQNLQLQAVPNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ 420 430 440 450 460 470 230 240 250 260 270 pF1KB9 AALPGSLHPAAGGLQTSLHS---PLGGYNSDYSG---LSHSAFSS--GASSHLLSPAGQ- . . .. .. : .: .. :... : .: .. . .:: : .. :: : CCDS44 TITLAPMQGVSLGQTSSSNTTLTPIASAASIPAGTVTVNAAQLSSMPGLQTINLSALGTS 480 490 500 510 520 530 280 290 300 310 320 pF1KB9 ----HLMDGFKPVLPGSYPDS--APSPLAGAGGSMLSAGPSAPLGG--SP--RSSARRYS : ..:. :. .. : . : : ::::. . .. : :: . .: : . CCDS44 GIQVHPIQGL-PLAIANAPGDHGAQLGLHGAGGDGIHDDTAGGEEGENSPDAQPQAGRRT 540 550 560 570 580 590 330 340 350 360 370 380 pF1KB9 GRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFV : .: :: :...: : .: ..: : ::: ::::::::::::.::::::::::::. CCDS44 RREACTCPYCKDSEGRG-SGDPGKKKQ-HICHIQGCGKVYGKTSHLRAHLRWHTGERPFM 600 610 620 630 640 650 390 400 410 420 430 440 pF1KB9 CNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGS :.: .:::::::::::::: :::::::.:::: : ::::::::::::.:::.. :: : CCDS44 CTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIKTHQNKKGGPGV 660 670 680 690 700 710 450 460 470 480 490 pF1KB9 AGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE : : . : . :: :....: CCDS44 ALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSGINVMQVADLQS 720 730 740 750 760 770 >>CCDS8857.1 SP1 gene_id:6667|Hs108|chr12 (785 aa) initn: 820 init1: 579 opt: 682 Z-score: 359.9 bits: 76.7 E(32554): 1e-13 Smith-Waterman score: 726; 33.6% identity (60.3% similar) in 473 aa overlap (36-470:273-740) 10 20 30 40 50 60 pF1KB9 CNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGVSGASR-NGG :... . : ..: : :. ::.. ..: CCDS88 NNVLSGQTQYVTNVPVALNGNITLLPVNSVSAATLTPSSQAVTISSSGSQESGSQPVTSG 250 260 270 280 290 300 70 80 90 100 110 120 pF1KB9 SSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSL----TSSSAAAAAAAAAAAASSSP .. ..:. ... :..... ... : . . .: ... ::.:... . . . :. CCDS88 TTISSASLVSSQASSSSFFTNANSYSTTTTTSNMGIMNFTTSGSSGTNSQGQTPQRVSGL 310 320 330 340 350 360 130 140 150 160 170 pF1KB9 FANDYSVFQAPGVSGGSGGGGGGGGGGSSAHSQDGSH--QPVFISKVHTSVDGLQGIYPR ..: .: .:::: .: : .. ..:. . :: .. . ....::. : CCDS88 QGSDALNIQQNQTSGGSLQAGQQKEGEQNQQTQQQQILIQPQLV-QGGQALQALQAA-PL 370 380 390 400 410 420 180 190 200 210 220 pF1KB9 VGMAHPYESWFK-----------P-SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSA :.. .. . : : : . . :: : :: . ..::::.. CCDS88 SGQTFTTQAISQETLQNLQLQAVPNSGPIIIRTPTVGPNGQVSWQTLQLQNLQVQNPQAQ 430 440 450 460 470 480 230 240 250 260 270 pF1KB9 AALPGSLHPAAGGLQTSLHS---PLGGYNSDYSG---LSHSAFSS--GASSHLLSPAGQ- . . .. .. : .: .. :... : .: .. . .:: : .. :: : CCDS88 TITLAPMQGVSLGQTSSSNTTLTPIASAASIPAGTVTVNAAQLSSMPGLQTINLSALGTS 490 500 510 520 530 540 280 290 300 310 320 pF1KB9 ----HLMDGFKPVLPGSYPDS--APSPLAGAGGSMLSAGPSAPLGG--SP--RSSARRYS : ..:. :. .. : . : : ::::. . .. : :: . .: : . CCDS88 GIQVHPIQGL-PLAIANAPGDHGAQLGLHGAGGDGIHDDTAGGEEGENSPDAQPQAGRRT 550 560 570 580 590 330 340 350 360 370 380 pF1KB9 GRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKTSHLKAHLRWHTGERPFV : .: :: :...: : .: ..: : ::: ::::::::::::.::::::::::::. CCDS88 RREACTCPYCKDSEGRG-SGDPGKKKQ-HICHIQGCGKVYGKTSHLRAHLRWHTGERPFM 600 610 620 630 640 650 390 400 410 420 430 440 pF1KB9 CNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDHLSKHVKTHSGGGGGGGS :.: .:::::::::::::: :::::::.:::: : ::::::::::::.:::.. :: : CCDS88 CTWSYCGKRFTRSDELQRHKRTHTGEKKFACPECPKRFMRSDHLSKHIKTHQNKKGGPGV 660 670 680 690 700 710 450 460 470 480 490 pF1KB9 AGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE : : . : . :: :....: CCDS88 ALSVGTLPLDSGAGSEGSGTATPSALITTNMVAMEAICPEGIARLANSGINVMQVADLQS 720 730 740 750 760 770 >>CCDS5373.1 SP4 gene_id:6671|Hs108|chr7 (784 aa) initn: 689 init1: 599 opt: 663 Z-score: 350.5 bits: 75.0 E(32554): 3.3e-13 Smith-Waterman score: 671; 32.3% identity (57.5% similar) in 492 aa overlap (27-470:281-758) 10 20 30 40 50 pF1KB9 MLAATCNKIGSPSPSPSSLSDSSSSFGKGFHPWKRSSSSSSASCNVVGSSLSSFGV :. .: ..:..: . ..:.. .. CCDS53 AQVVTTLPINIGGVTLALPVINNVAAGGGTGQVGQPAATADSGTSNGNQLVSTPTNTTTS 260 270 280 290 300 310 60 70 80 90 100 110 pF1KB9 SGASRNGGSSSAAAAAAAAAAAAAALVSDSFSCGGSPGSSAFSLTSSSAAAAAAAAAAAA ... .. :::.. ...:... .. ::.. ... :. : . .::: . . . :: CCDS53 ASTMPESPSSSTTCTTTASTSLTS---SDTLVSSADTGQYASTSASSSERTIEESQTPAA 320 330 340 350 360 120 130 140 150 160 170 pF1KB9 SSSPFANDYSVFQAPGVSGGSGGGGGGGGG---GSSAHSQDGSHQPV--FISKVHTSVDG . : :.. : .: :..... ... :. .: .:: .:. . . CCDS53 TESE-AQSSSQLQPNGMQNAQDQSNSLQQVQIVGQPILQQIQIQQPQQQIIQAIPPQSFQ 370 380 390 400 410 420 180 190 200 210 220 pF1KB9 LQ-GIYPRVGMAHPYES-WFKPSHPG--LGAAGEVGSAGASSWWDVGAGWI----DVQNP :: : .. . .: .. .. .: : : . .: :: : . : ..: CCDS53 LQSGQTIQTIQQQPLQNVQLQAVNPTQVLIRAPTLTPSGQISWQTVQVQNIQSLSNLQVQ 430 440 450 460 470 480 230 240 250 260 pF1KB9 NSAAALPGSLHP--AAGGLQTSLHSPLGGYNSDYSGLSHSAFSS---------------- :.. . .. : ..:: . .:.. .. . :. . ..: CCDS53 NAGLSQQLTITPVSSSGGTTLAQIAPVAVAGAPIT-LNTAQLASVPNLQTVSVANLGAAG 490 500 510 520 530 540 270 280 290 300 310 pF1KB9 ----GASSHLLSPAGQHL-MDGFKPVLPGSYPDSAPSPLAGAGGSMLSAGPSAP------ :. . : :::. .:: : : .. :: .: .: . . : .: CCDS53 VQVQGVPVTITSVAGQQQGQDGVK-VQQATI---APVTVAVGGIANATIGAVSPDQLTQV 550 560 570 580 590 600 320 330 340 350 360 pF1KB9 --LGGSPRSSARRYSG----RATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYG :. :. . : :..:.::::.:.: : .. .: : ::: ::::::: CCDS53 HLQQGQQTSDQEVQPGKRLRRVACSCPNCREGE--GRGSNEPGKKKQHICHIEGCGKVYG 610 620 630 640 650 370 380 390 400 410 420 pF1KB9 KTSHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRS :::::.::::::::::::.:::.::::::::::::::: ::::::::: :: :.:::::: CCDS53 KTSHLRAHLRWHTGERPFICNWMFCGKRFTRSDELQRHRRTHTGEKRFECPECSKRFMRS 660 670 680 690 700 710 430 440 450 460 470 480 pF1KB9 DHLSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNG ::::::::::.. ::: . . ..:. : : . ::: CCDS53 DHLSKHVKTHQNKKGGGTALAIVTSGELDS---SVTEVLGSPRIVTVAAISQDSNPATPN 720 730 740 750 760 770 490 pF1KB9 LE CCDS53 VSTNMEEF 780 >>CCDS33322.1 SP5 gene_id:389058|Hs108|chr2 (398 aa) initn: 651 init1: 597 opt: 653 Z-score: 349.0 bits: 73.7 E(32554): 4.1e-13 Smith-Waterman score: 669; 53.2% identity (65.1% similar) in 218 aa overlap (222-438:179-378) 200 210 220 230 240 250 pF1KB9 SHPGLGAAGEVGSAGASSWWDVGAGWIDVQNPNSAAA-LPGSLHPAAGGLQTSLHSPLGG .:: : :: : ::. . : .: CCDS33 YAAQAALPPGYSNLLPPPPPPPPPPTCRQLSPNPAPDDLPWWSIPQAGAGPGASGVPGSG 150 160 170 180 190 200 260 270 280 290 300 310 pF1KB9 YNSDYSGLSHSAFSSGASSHLLSPAGQHLMDGFKPVLPGSYPDSAPSPLAGAGGSMLSAG .. .: : : ::. . :. :. :. :: : . : .: ..:.. CCDS33 LSGACAGAPH-APRFPASAAAAAAAAAALQRGL--VLGPSDFAQYQSQIA----ALLQT- 210 220 230 240 250 260 320 330 340 350 360 370 pF1KB9 PSAPLGGSPRSSARRYSGRATCDCPNCQEAERLGPAGASLRRKGLHSCHIPGCGKVYGKT .:::... : : : ::::: : : : .: : ::.:::::::::: CCDS33 -KAPLAATARRCRR-------CRCPNCQAAG--GAPEAEPGKKKQHVCHVPGCGKVYGKT 270 280 290 300 310 380 390 400 410 420 430 pF1KB9 SHLKAHLRWHTGERPFVCNWLFCGKRFTRSDELQRHLRTHTGEKRFACPVCNKRFMRSDH ::::::::::::::::::::::::: ::::::::::::::::::::::: :.:::::::: CCDS33 SHLKAHLRWHTGERPFVCNWLFCGKSFTRSDELQRHLRTHTGEKRFACPECGKRFMRSDH 320 330 340 350 360 370 440 450 460 470 480 490 pF1KB9 LSKHVKTHSGGGGGGGSAGSGSGGKKGSDTDSEHSAAGSPPCHSPELLQPPEPGHRNGLE :.:::::: CCDS33 LAKHVKTHQNKKLKVAEAGVKREDARDL 380 390 490 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Fri Nov 4 19:54:42 2016 done: Fri Nov 4 19:54:43 2016 Total Scan time: 3.740 Total Display time: 0.060 Function used was FASTA [36.3.4 Apr, 2011]