FASTA searches a protein or DNA sequence data bank 36.3.4 Apr, 2011 Please cite: W.R. Pearson & D.J. Lipman PNAS (1988) 85:2444-2448 Query: pF1KB6196, 706 aa 1>>>pF1KB6196 706 - 706 aa - 706 aa Library: human.CCDS.faa 18511270 residues in 32554 sequences Statistics: Expectation_n fit: rho(ln(x))= 11.3820+/-0.00106; mu= -4.1207+/- 0.065 mean_var=416.4300+/-85.855, 0's: 0 Z-trim(116.6): 45 B-trim: 0 in 0/51 Lambda= 0.062850 statistics sampled from 17200 (17243) to 17200 sequences Algorithm: FASTA (3.7 Nov 2010) [optimized] Parameters: BL50 matrix (15:-5), open/ext: -10/-2 ktup: 2, E-join: 1 (0.788), E-opt: 0.2 (0.53), width: 16 Scan time: 5.050 The best scores are: opt bits E(32554) CCDS41899.1 DACH1 gene_id:1602|Hs108|chr13 ( 706) 4597 431.1 2.7e-120 CCDS48140.1 DACH2 gene_id:117154|Hs108|chrX ( 571) 1430 143.9 6.5e-34 CCDS55457.1 DACH2 gene_id:117154|Hs108|chrX ( 432) 943 99.6 1e-20 CCDS14455.1 DACH2 gene_id:117154|Hs108|chrX ( 599) 943 99.7 1.3e-20 >>CCDS41899.1 DACH1 gene_id:1602|Hs108|chr13 (706 aa) initn: 4597 init1: 4597 opt: 4597 Z-score: 2273.1 bits: 431.1 E(32554): 2.7e-120 Smith-Waterman score: 4597; 100.0% identity (100.0% similar) in 706 aa overlap (1-706:1-706) 10 20 30 40 50 60 pF1KB6 MAVPAALIPPTQLVPPQPPISTSASSSGTTTSTSSATSSPAPSIGPPASSGPTLFRPEPI :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 MAVPAALIPPTQLVPPQPPISTSASSSGTTTSTSSATSSPAPSIGPPASSGPTLFRPEPI 10 20 30 40 50 60 70 80 90 100 110 120 pF1KB6 ASAAAAAATVTSTGGGGGGGGSGGGGGSSGNGGGGGGGGGGSNCNPNLAAASNGSGGGGG :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 ASAAAAAATVTSTGGGGGGGGSGGGGGSSGNGGGGGGGGGGSNCNPNLAAASNGSGGGGG 70 80 90 100 110 120 130 140 150 160 170 180 pF1KB6 GISAGGGVASSTPINASTGSSSSSSSSSSSSSSSSSSSSSSSSCGPLPGKPVYSTPSPVE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 GISAGGGVASSTPINASTGSSSSSSSSSSSSSSSSSSSSSSSSCGPLPGKPVYSTPSPVE 130 140 150 160 170 180 190 200 210 220 230 240 pF1KB6 NTPQNNECKMVDLRGAKVASFTVEGCELICLPQAFDLFLKHLVGGLHTVYTKLKRLEITP :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NTPQNNECKMVDLRGAKVASFTVEGCELICLPQAFDLFLKHLVGGLHTVYTKLKRLEITP 190 200 210 220 230 240 250 260 270 280 290 300 pF1KB6 VVCNVEQVRILRGLGAIQPGVNRCKLISRKDFETLYNDCTNASSRPGRPPKRTQSVTSPE :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 VVCNVEQVRILRGLGAIQPGVNRCKLISRKDFETLYNDCTNASSRPGRPPKRTQSVTSPE 250 260 270 280 290 300 310 320 330 340 350 360 pF1KB6 NSHIMPHSVPGLMSPGIIPPTGLTAAAAAAAAATNAAIAEAMKVKKIKLEAMSNYHASNN :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 NSHIMPHSVPGLMSPGIIPPTGLTAAAAAAAAATNAAIAEAMKVKKIKLEAMSNYHASNN 310 320 330 340 350 360 370 380 390 400 410 420 pF1KB6 QHGADSENGDMNSSVGLELPFMMMPHPLIPVSLPPASVTMAMSQMNHLSTIANMAAAAQV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QHGADSENGDMNSSVGLELPFMMMPHPLIPVSLPPASVTMAMSQMNHLSTIANMAAAAQV 370 380 390 400 410 420 430 440 450 460 470 480 pF1KB6 QSPPSRVETSVIKERVPDSPSPAPSLEEGRRPGSHPSSHRSSSVSSSPARTESSSDRIPV :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 QSPPSRVETSVIKERVPDSPSPAPSLEEGRRPGSHPSSHRSSSVSSSPARTESSSDRIPV 430 440 450 460 470 480 490 500 510 520 530 540 pF1KB6 HQNGLSMNQMLMGLSPNVLPGPKEGDLAGHDMGHESKRMHIEKDETPLSTPTARDSLDKL :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 HQNGLSMNQMLMGLSPNVLPGPKEGDLAGHDMGHESKRMHIEKDETPLSTPTARDSLDKL 490 500 510 520 530 540 550 560 570 580 590 600 pF1KB6 SLTGHGQPLPPGFPSPFLFPDGLSSIETLLTNIQGLLKVAIDNARAQEKQVQLEKTELKM :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 SLTGHGQPLPPGFPSPFLFPDGLSSIETLLTNIQGLLKVAIDNARAQEKQVQLEKTELKM 550 560 570 580 590 600 610 620 630 640 650 660 pF1KB6 DFLRERELRETLEKQLAMEQKNRAIVQKRLKKEKKAKRKLQEALEFETKRREQAEQTLKQ :::::::::::::::::::::::::::::::::::::::::::::::::::::::::::: CCDS41 DFLRERELRETLEKQLAMEQKNRAIVQKRLKKEKKAKRKLQEALEFETKRREQAEQTLKQ 610 620 630 640 650 660 670 680 690 700 pF1KB6 AASTDSLRVLNDSLTPEIEADRSGGRTDAERTIQDGRLYLKTTVMY :::::::::::::::::::::::::::::::::::::::::::::: CCDS41 AASTDSLRVLNDSLTPEIEADRSGGRTDAERTIQDGRLYLKTTVMY 670 680 690 700 >>CCDS48140.1 DACH2 gene_id:117154|Hs108|chrX (571 aa) initn: 1899 init1: 651 opt: 1430 Z-score: 722.3 bits: 143.9 E(32554): 6.5e-34 Smith-Waterman score: 1848; 52.6% identity (70.3% similar) in 620 aa overlap (148-689:4-566) 120 130 140 150 160 170 pF1KB6 GGGGISAGGGVASSTPINASTGSSSSSSSSSSSSSSSSSSSSSSSSCGPLPGKPVYSTPS :.: :..::... : . ..:.:::: CCDS48 MAVSASPVISATSSGAGVPGGLFRAEPLYSTPR 10 20 30 180 190 200 210 pF1KB6 -PVENTPQ-----------------------NNECKMVDLRGAKVASFTVEGCELICLPQ : . ::. .:::.:::..: ::::: ..: ::::::: CCDS48 EPPRLTPNMINSFVVNNHSNSAGGGGRGNTNTNECRMVDMHGMKVASFLMDGQELICLPQ 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB6 AFDLFLKHLVGGLHTVYTKLKRLEITPVVCNVEQVRILRGLGAIQPGVNRCKLISRKDFE .::::::::::::::::::::::.:.::::.:::::::::::::::::::::::.::::: CCDS48 VFDLFLKHLVGGLHTVYTKLKRLDISPVVCTVEQVRILRGLGAIQPGVNRCKLITRKDFE 100 110 120 130 140 150 280 290 300 310 320 330 pF1KB6 TLYNDCTNASSRPGRPPKRTQSVTSPENSHIMPHSVPGLMSPGIIPPTGLTAAAAAAAAA ::..:::::::::::::::. .: . ::.... :.::::.:::.: :::.:::: CCDS48 TLFTDCTNASSRPGRPPKRSLGVLQ-ENARLLTHAVPGLLSPGLITPTGITAAA------ 160 170 180 190 200 340 350 360 370 pF1KB6 TNAAIAEAMKVKKIKLEAMSNYHASNNQHGADSENGDMNSSVG----------------- .:::::..:.:: ::.. .....:.:..:: :.::..: CCDS48 ----MAEAMKLQKMKLMAMNTLQGNGSQNGTESEPDDLNSNTGGSESSWDKDKMQSPFAA 210 220 230 240 250 260 380 390 400 pF1KB6 ------------------------------------LELPFMMMPHPLIPVSLPPASVTM :.::::::::::.:::::::::.: CCDS48 PGPQHGIAHAALAGQPGIGGAPTLNPLQQNHLLTNRLDLPFMMMPHPLLPVSLPPASVAM 270 280 290 300 310 320 410 420 430 440 450 460 pF1KB6 AMSQMNHLSTIANMAAAAQVQSPPSRVETSVIKERVPDSPSPAPSLEEGRRPGSHPSSHR ::.:::::.::::::::::..:: ::. :::::::.:.::::::::::..::::. ::: CCDS48 AMNQMNHLNTIANMAAAAQIHSPLSRAGTSVIKERIPESPSPAPSLEENHRPGSQTSSHT 330 340 350 360 370 380 470 480 490 500 510 520 pF1KB6 SSSVSSSPARTESSSDRIPVHQNGLSMNQMLMGLSPNVLPGPKEGDLAGHDMGHESKRMH ::::::::.. : :. .:: CCDS48 SSSVSSSPSQ-----------------------------------------MDHHLERM- 390 400 530 540 550 560 570 580 pF1KB6 IEKDETPLSTPTARDSLDKLSLTGHGQPLPPGFPSPFLFPDGLSSIETLLTNIQGLLKVA .:.:.. : .. :::..:: :: :: :::.::.: :.:::.:::::::::::::: CCDS48 ---EEVPVQIPIMKSPLDKIQLTP-GQALPAGFPGPFIFADSLSSVETLLTNIQGLLKVA 410 420 430 440 450 590 600 610 620 630 640 pF1KB6 IDNARAQEKQVQLEKTELKMDFLRERELRETLEKQLAMEQKNRAIVQKRLKKEKKAKRKL .:::: ::::.: :: ::.... ::::.::.::.:::.: ..:. .:::::::::.:::: CCDS48 LDNARIQEKQIQQEKKELRLELYREREIRENLERQLAVELQSRTTMQKRLKKEKKTKRKL 460 470 480 490 500 510 650 660 670 680 690 pF1KB6 QEALEFETKRREQAEQTLKQAASTDS-LRVLNDSLTPEIEADRSGGRTDAERTIQDGRLY :::::::.:::::.::.::::...:: ::.:.:. :.:: . .: :. CCDS48 QEALEFESKRREQVEQALKQATTSDSGLRMLKDTGIPDIEIENNGTPHDSAAMQA 520 530 540 550 560 570 700 pF1KB6 LKTTVMY >>CCDS55457.1 DACH2 gene_id:117154|Hs108|chrX (432 aa) initn: 1292 init1: 577 opt: 943 Z-score: 485.2 bits: 99.6 E(32554): 1e-20 Smith-Waterman score: 1277; 49.5% identity (67.9% similar) in 471 aa overlap (283-699:9-421) 260 270 280 290 300 310 pF1KB6 GLGAIQPGVNRCKLISRKDFETLYNDCTNASSRPGRPPKRTQSVTSPENSHIMPHSVPGL ::::::::::. .: . ::.... :.:::: CCDS55 MTRKQAVNSSRPGRPPKRSLGVLQ-ENARLLTHAVPGL 10 20 30 320 330 340 350 360 370 pF1KB6 MSPGIIPPTGLTAAAAAAAAATNAAIAEAMKVKKIKLEAMSNYHASNNQHGADSENGDMN .:::.: :::.:::: .:::::..:.:: ::.. .....:.:..:: :.: CCDS55 LSPGLITPTGITAAA----------MAEAMKLQKMKLMAMNTLQGNGSQNGTESEPDDLN 40 50 60 70 80 pF1KB6 SSVG-----------------------------------------------------LEL :..: :.: CCDS55 SNTGGSESSWDKDKMQSPFAAPGPQHGIAHAALAGQPGIGGAPTLNPLQQNHLLTNRLDL 90 100 110 120 130 140 380 390 400 410 420 430 pF1KB6 PFMMMPHPLIPVSLPPASVTMAMSQMNHLSTIANMAAAAQVQSPPSRVETSVIKERVPDS :::::::::.:::::::::.:::.:::::.::::::::::..:: ::. :::::::.:.: CCDS55 PFMMMPHPLLPVSLPPASVAMAMNQMNHLNTIANMAAAAQIHSPLSRAGTSVIKERIPES 150 160 170 180 190 200 440 450 460 470 480 490 pF1KB6 PSPAPSLEEGRRPGSHPSSHRSSSVSSSPARTESSSDRIPVHQNGLSMNQMLMGLSPNVL :::::::::..::::. ::: ::::::::.. CCDS55 PSPAPSLEENHRPGSQTSSHTSSSVSSSPSQ----------------------------- 210 220 230 500 510 520 530 540 550 pF1KB6 PGPKEGDLAGHDMGHESKRMHIEKDETPLSTPTARDSLDKLSLTGHGQPLPPGFPSPFLF : :. .:: .:.:.. : .. :::..:: :: :: :::.::.: CCDS55 ------------MDHHLERM----EEVPVQIPIMKSPLDKIQLTP-GQALPAGFPGPFIF 240 250 260 270 280 560 570 580 590 600 610 pF1KB6 PDGLSSIETLLTNIQGLLKVAIDNARAQEKQVQLEKTELKMDFLRERELRETLEKQLAME :.:::.::::::::::::::.:::: ::::.: :: ::.... ::::.::.::.:::.: CCDS55 ADSLSSVETLLTNIQGLLKVALDNARIQEKQIQQEKKELRLELYREREIRENLERQLAVE 290 300 310 320 330 340 620 630 640 650 660 670 pF1KB6 QKNRAIVQKRLKKEKKAKRKLQEALEFETKRREQAEQTLKQAASTDS-LRVLNDSLTPEI ..:. .:::::::::.:::::::::::.:::::.::.::::...:: ::.:.:. :.: CCDS55 LQSRTTMQKRLKKEKKTKRKLQEALEFESKRREQVEQALKQATTSDSGLRMLKDTGIPDI 350 360 370 380 390 400 680 690 700 pF1KB6 EADRSGGRTDAERTIQDGRLYLKTTVMY : . .: :. ..: : : CCDS55 EIENNGTPHDSA-AMQGGNYYCLEMAQQLYSA 410 420 430 >>CCDS14455.1 DACH2 gene_id:117154|Hs108|chrX (599 aa) initn: 1787 init1: 577 opt: 943 Z-score: 483.4 bits: 99.7 E(32554): 1.3e-20 Smith-Waterman score: 1821; 51.2% identity (68.6% similar) in 643 aa overlap (148-699:4-588) 120 130 140 150 160 170 pF1KB6 GGGGISAGGGVASSTPINASTGSSSSSSSSSSSSSSSSSSSSSSSSCGPLPGKPVYSTPS :.: :..::... : . ..:.:::: CCDS14 MAVSASPVISATSSGAGVPGGLFRAEPLYSTPR 10 20 30 180 190 200 210 pF1KB6 -PVENTPQ-----------------------NNECKMVDLRGAKVASFTVEGCELICLPQ : . ::. .:::.:::..: ::::: ..: ::::::: CCDS14 EPPRLTPNMINSFVVNNHSNSAGGGGRGNTNTNECRMVDMHGMKVASFLMDGQELICLPQ 40 50 60 70 80 90 220 230 240 250 260 270 pF1KB6 AFDLFLKHLVGGLHTVYTKLKRLEITPVVCNVEQVRILRGLGAIQPGVNRCKLISRKDFE .::::::::::::::::::::::.:.::::.:::::::::::::::::::::::.::::: CCDS14 VFDLFLKHLVGGLHTVYTKLKRLDISPVVCTVEQVRILRGLGAIQPGVNRCKLITRKDFE 100 110 120 130 140 150 280 290 300 310 320 pF1KB6 TLYNDCTNA-------------SSRPGRPPKRTQSVTSPENSHIMPHSVPGLMSPGIIPP ::..::::: ::::::::::. .: . ::.... :.::::.:::.: : CCDS14 TLFTDCTNARRKRQMTRKQAVNSSRPGRPPKRSLGVLQ-ENARLLTHAVPGLLSPGLITP 160 170 180 190 200 210 330 340 350 360 370 pF1KB6 TGLTAAAAAAAAATNAAIAEAMKVKKIKLEAMSNYHASNNQHGADSENGDMNSSVG---- ::.::: :.:::::..:.:: ::.. .....:.:..:: :.::..: CCDS14 TGITAA----------AMAEAMKLQKMKLMAMNTLQGNGSQNGTESEPDDLNSNTGGSES 220 230 240 250 260 380 pF1KB6 -------------------------------------------------LELPFMMMPHP :.::::::::: CCDS14 SWDKDKMQSPFAAPGPQHGIAHAALAGQPGIGGAPTLNPLQQNHLLTNRLDLPFMMMPHP 270 280 290 300 310 320 390 400 410 420 430 440 pF1KB6 LIPVSLPPASVTMAMSQMNHLSTIANMAAAAQVQSPPSRVETSVIKERVPDSPSPAPSLE :.:::::::::.:::.:::::.::::::::::..:: ::. :::::::.:.::::::::: CCDS14 LLPVSLPPASVAMAMNQMNHLNTIANMAAAAQIHSPLSRAGTSVIKERIPESPSPAPSLE 330 340 350 360 370 380 450 460 470 480 490 500 pF1KB6 EGRRPGSHPSSHRSSSVSSSPARTESSSDRIPVHQNGLSMNQMLMGLSPNVLPGPKEGDL :..::::. ::: ::::::::.. CCDS14 ENHRPGSQTSSHTSSSVSSSPSQ------------------------------------- 390 400 510 520 530 540 550 560 pF1KB6 AGHDMGHESKRMHIEKDETPLSTPTARDSLDKLSLTGHGQPLPPGFPSPFLFPDGLSSIE : :. .:: .:.:.. : .. :::..:: :: :: :::.::.: :.:::.: CCDS14 ----MDHHLERM----EEVPVQIPIMKSPLDKIQLTP-GQALPAGFPGPFIFADSLSSVE 410 420 430 440 450 570 580 590 600 610 620 pF1KB6 TLLTNIQGLLKVAIDNARAQEKQVQLEKTELKMDFLRERELRETLEKQLAMEQKNRAIVQ :::::::::::::.:::: ::::.: :: ::.... ::::.::.::.:::.: ..:. .: CCDS14 TLLTNIQGLLKVALDNARIQEKQIQQEKKELRLELYREREIRENLERQLAVELQSRTTMQ 460 470 480 490 500 510 630 640 650 660 670 680 pF1KB6 KRLKKEKKAKRKLQEALEFETKRREQAEQTLKQAASTDS-LRVLNDSLTPEIEADRSGGR ::::::::.:::::::::::.:::::.::.::::...:: ::.:.:. :.:: . .: CCDS14 KRLKKEKKTKRKLQEALEFESKRREQVEQALKQATTSDSGLRMLKDTGIPDIEIENNGTP 520 530 540 550 560 570 690 700 pF1KB6 TDAERTIQDGRLYLKTTVMY :. ..: : : CCDS14 HDSA-AMQGGNYYCLEMAQQLYSA 580 590 706 residues in 1 query sequences 18511270 residues in 32554 library sequences Tcomplib [36.3.4 Apr, 2011] (8 proc) start: Mon Nov 7 15:35:27 2016 done: Mon Nov 7 15:35:28 2016 Total Scan time: 5.050 Total Display time: 0.040 Function used was FASTA [36.3.4 Apr, 2011]